PočítačeTypy súborov

Formáte CSV, alebo kam dať čiarku?

Medzi aplikáciami, tvárou v tvár, ak nie programátor, je to už pokročilý používateľ, import dát z jednej aplikácie do druhej nedochádza len veľmi zriedka. A dosť často je nutné importovať tabuľkových dát, ktoré v skutočnosti bol vytvorený vo formáte CSV. Ktorí vyvinuli niekoľko alternatívnych riešení (XML vedúci medzi nimi). Ale vytvorenie súboru CSV, v niektorých prípadoch je najvhodnejšie riešenie, a niektoré z nich - najproblematickejšie.

To je skratka pre názov formátu ako commaseparatedvalues - hodnoty oddelené čiarkou. V programe Poznámkový blok súboru takto:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (na konci znamenie put nie je nutná)

A v tabuľkovom procesore alebo podobné aplikácie Excel už takto:

00 01 02 03
01 15 34 11
16 27 33 06

Ale teraz sme diskutovali o najjednoduchší prípad. Problémy začínajú práve z toho dôvodu, že vzhľadom na veľmi stlačený vykazovanie dát vo formáte CSV sa používa pre prenos veľkého množstva informácií. Najčastejšie v databázach rôznych hodnôt: numerické, alfa, alfanumerické, s priestormi atď Často vo veľké pole sú chyby, a ak, napríklad, niekde bude navyše čiarka v obsahu jedného z polí, všetky bunky môže byť premiestnený raz.

Všeobecne platí, že problémy vznikajú pri importe dát pomocou formátu CSV, možno rozdeliť do troch kategórií:

1 - Nesprávne vyplňovanie poľa.

2 - Nesprávne konverziu dát pri ukladaní do súboru CSV.

3 - nesprávne účtovanie Program formát dovozcu.

V prvom prípade sa nám čiastočne skúmaná. Pre boj s problémom, je potrebné zabezpečiť prostriedky na sledovanie správnosť zadaných údajov. Napríklad, ak je potrebné zhromaždiť databázu adries pre mailing listu, existujú špeciálne skripty, ktoré overujú, či daná osoba vstúpila na e-mail v správnom formáte. Tam, kde existujú medzery, čiarky a akékoľvek ďalšie údaje, ktoré možno čítať v poriadku, obsah poľa musí byť v úvodzovkách (tzv počítač "").

Druhý prípad je spojený s výberom kódovania. Je potrebné zistiť, je často skúsený tým, čo preferujú kódovanie importu program. V systéme Windows bežne používané v roku 1251, takže v prípade, že pôvodný súbor bude spĺňať text Unicode, nasledovať bude zobrazený v cieľovej aplikácie ako reťazec otázok. V Excel, ktoré možno uložiť do CSV formátu s rôznymi kódovanie a oddeľovač (s výnimkou bod stále v použití na kartu, a bodkočiarka), ale to je najlepšie k vytvoreniu súboru v Notepad ++ alebo OpenOffice.org Calc.

Tretí prípad - dôsledok sekundy. Historicky formáte CSV nemá jednotný štandard. Mnoho programov sú vnímané ako CSV a súbor TSV (oddelený tabulátormi) a SCSV (oddelené bodkočiarkou), najmä preto, že prípona súboru nie je hlásená o tom. V tomto prípade, dáta prečítané nesprávne a nie sú pridelené medzi bunkami v správnom poradí. To najlepšie, čo môžeme poradiť - vytvorenie súboru CSV osobne. Ako už bolo spomenuté, je potrebné využiť výhodnú editora.

Triky, ako skrotiť formáte CSV, známe programátorom. Jednoduché užívateľ musí dodržiavať naše odporúčania pre vytvorenie súboru. Najmenej zo všetkých problémov dochádza, keď je súbor vytvorený špeciálne pre dovoz na konkrétnu aplikáciu (a niekedy aj inak). Je to jednoduchšie vziať do úvahy všetky možné problémy, s ktorými sa stretávajú v dátach.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sk.atomiyme.com. Theme powered by WordPress.