logo

CSV failų skaitymas Python

A CSV (kableliais atskirtos reikšmės) failas yra paprasto teksto dokumento forma, kuri naudoja tam tikrą formatą lentelės informacijai tvarkyti. CSV failo formatas yra apribotas tekstinis dokumentas, kurio reikšmėms atskirti naudojamas kablelis. Kiekviena dokumento eilutė yra duomenų žurnalas. Kiekvieną žurnalą sudaro vienas ar daugiau laukų, padalytų kableliais. Tai populiariausias failų formatas, skirtas importuoti ir eksportuoti skaičiuokles ir duomenų bazes.

CSV failo skaitymas

Yra įvairių būdų, kaip skaityti CSV failą Python kurie naudoja arba CSV modulį, arba pandų biblioteką.



  • csv modulis: CSV modulis yra vienas iš Python modulių, kuriame pateikiamos lentelės informacijos skaitymo ir rašymo CSV failo formatu klasės.
  • pandų biblioteka: Pandos biblioteka yra viena iš atvirojo kodo Python bibliotekų, teikiančių didelio našumo, patogias duomenų struktūras ir duomenų analizės įrankius bei metodus Python programavimui.

CSV failo formato skaitymas Python:
Apsvarstykite toliau pateiktą CSV failą pavadinimu „Milžinai.CSV“ :

Naudojant csv.reader()

Iš pradžių CSV failas atidaromas naudojant atviras() metodas „r“ režimu (nurodo skaitymo režimą atidarant failą), kuris grąžina failo objektą, tada jis nuskaitomas naudojant CSV modulio skaitytuvo () metodą, kuris grąžina skaitymo objektą, kuris kartojasi nurodytose CSV dokumento eilutėse.
Pastaba: The 'su' raktinis žodis naudojamas kartu su open() metodu, nes jis supaprastina išimčių tvarkymą ir automatiškai uždaro CSV failą.



mašinraštis kiekvienam

Pavyzdys: Šis kodas nuskaito ir spausdina pavadinto CSV failo turinį „Milžinai.csv“ naudojantcsv>modulis Python. Jis atidaro failą skaitymo režimu, nuskaito eilutes ir spausdina jas po vieną naudodami afor>kilpa. The csv.reader()> funkcija naudojama nuskaityti CSV failą, o duomenys iš kiekvienos eilutės spausdinami į konsolę.

Python3






js onclick

import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>)as>file>:> >csvFile>=> csv.reader(>file>)> >for> lines>in> csvFile:> >print>(lines)>

>

>

Išvestis:

['Organization', 'CEO', 'Established'] ['Alphabet', 'Sundar Pichai', '02-Oct-15'] ['Microsoft', 'Satya Nadella', '04-Apr-75'] ['Amazon', 'Jeff Bezos', '05-Jul-94']>

Naudojant csv.DictReader() klasę

Tai panašu į ankstesnį metodą, CSV failas pirmiausia atidaromas naudojant Open() metodas tada jis skaitomas naudojant csv modulio DictReader klasę, kuri veikia kaip įprastas skaitytuvas, tačiau CSV failo informaciją susieja į žodyną. Pačią pirmąją failo eilutę sudaro žodyno raktai.

konvertuoti eilutę į int Java

Pavyzdys: Šis kodas nuskaito ir spausdina CSV failo, pavadinto „Giants.csv“, turinį naudodamascsv>modulis suDictReader>. Jis atidaro failą skaitymo režimu, nuskaito eilutes ir spausdina jas po vieną.csv.DictReader()>nuskaito CSV failą ir pirmąją eilutę traktuoja kaip antraštes, sukurdamas žodyną kiekvienai eilutei, kurioje antraštės reikšmės yra raktai. Kodas spausdina kiekvieną eilutę kaip žodyną, todėl lengviau dirbti su struktūriniais CSV duomenimis.

Python3




import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>) as>file>:> >csvFile>=> csv.DictReader(>file>)> >for> lines>in> csvFile:> >print>(lines)>

>

gražiausia šypsena

>

Išvestis:

OrderedDict ([('Organizacija', 'Abėcėlė'), ('CEO', 'Sundar Pichai'), ('Įsteigta', '02-spalio-15')])
OrderedDict ([('Organization', 'Microsoft'), ('CEO', 'Satya Nadella'), ('Įsteigta', '04-Apr-75')])
OrderedDict ([('Organization', 'Amazon'), ('CEO', 'Jeff Bezos'), ('Įsteigta', '05-Lie-94')])

Naudojant pandas.read_csv() metodą

Labai lengva ir paprasta skaityti CSV failą naudojant pandos bibliotekos funkcijas. Čia read_csv() metodas pandas bibliotekos naudojama duomenims iš CSV failų nuskaityti.

Pavyzdys: Šis kodas naudojapandas>biblioteka, skirta skaityti ir rodyti CSV failo, pavadinto pavadinimu, turinį „Milžinai.csv.“ Jis nuskaito CSV failą ir išsaugo jį kaip „DataFrame“, naudodamas pandas.read_csv()> funkcija. Galiausiai jis išspausdina visą „DataFrame“, kuriame pateikiamas struktūrinis ir lentelės pavidalo CSV duomenų vaizdas. Tai yra įprastas metodas dirbant su lentelių duomenimis Python, aspandas>siūlo galingus duomenų apdorojimo ir analizės įrankius.

Python3




import> pandas> csvFile>=> pandas.read_csv(>'Giants.csv'>)> print>(csvFile)>

>

>

Išvestis:

saugomų programų valdymas
Organization CEO Established 0 Alphabet Sundar Pichai 02-Oct-15 1 Microsoft Satya Nadella 04-Apr-75 2 Amazon Jeff Bezos 05-Jul-94>

Pastaba: Norėdami sužinoti daugiau apie pandas.csv_read() paspauskite čia .