Solusi bebas Pandas bagi mereka yang tidak terbiasa dengan modul ini.

Salah satu cara paling umum untuk memformat data adalah sebagai file CSV. Ini adalah bentuk penyimpanan yang nyaman karena aplikasi spreadsheet seperti Excel dan Google Sheets dapat dengan mudah menampilkan data berformat CSV dalam bentuk tabel. Pada artikel ini, saya akan membahas tentang cara memformat data sebagai CSV dengan Python tanpa menggunakan Pandas. Ada dua alasan utama untuk ini:

  1. Pemrogram Python yang tidak terbiasa dengan Pandas mungkin masih perlu bekerja dengan Pandas.
  2. Memahami cara memformat file CSV secara manual memberikan wawasan penting tentang bagaimana data Anda sebenarnya diformat di bawah permukaan. Pemahaman yang lebih mendalam ini dapat berguna bagi seorang programmer yang perlu memanipulasi dan memproses data ini.

Saya akan membagi sisa artikel menjadi dua bagian: 1) struktur file CSV dan 2) mendefinisikan struktur ini dengan Python.

Bagaimana sebenarnya tampilan file CSV?

Sebelum mencoba membuat file CSV kita sendiri dengan Python, kita perlu memahami seperti apa sebenarnya bentuk CSV. Akronim CSV adalah singkatan dari nilai yang dipisahkan koma. Dengan kata lain, jika Anda menganggap tabel data sebagai file CSV, Anda dapat membayangkan bahwa entri tabel dipisahkan dengan koma.

Mari kita lihat contoh konkritnya. Katakanlah saya mengetik teks berikut menggunakan aplikasi Windows Desktop Notepad (umumnya digunakan untuk membuat file teks dasar):

name, age, color
Tom, 22, gold
Todd, 34, blue
Kelly, 21, green
Avril, 27, purple

Oke, ini sepertinya tidak terlalu rumit, tapi agak tidak jelas apa yang terjadi jika diketik dengan cara ini. Namun, jika kita kemudian menyimpan file ini dengan ekstensi .csv dan melanjutkan untuk membukanya di Excel, kita mendapatkan spreadsheet berikut:

Agak keren, bukan? Setiap nilai yang dipisahkan dengan koma mendefinisikan kolom baru, dan setiap kumpulan nilai yang dipisahkan oleh baris baru mendefinisikan baris baru. Sekarang Anda tahu cara menulis file CSV Anda sendiri dari awal! Selanjutnya, mari pertimbangkan bagaimana kita dapat melakukan ini dengan kode.

Bagaimana Anda bisa membuat file CSV dengan Python?

Python memiliki beberapa cara bawaan untuk menangani file CSV (termasuk Pandas, yang disebutkan di atas, serta modul csv); namun, itu adalah topik untuk artikel lain. Hari ini, saya ingin menunjukkan kepada Anda cara membuat file Anda sendiri secara terprogram dari awal. Ada beberapa alasan untuk ini:

  1. Menggunakan Pandas untuk mendefinisikan CSV Anda memerlukan pemahaman tentang pemrosesan dan manipulasi data menggunakan struktur data Pandas, dan saya ingin artikel ini tetap dapat diakses oleh pembaca yang perlu bekerja dengan file CSV tetapi mungkin tidak mengetahui Pandas.
  2. Modul lain (seperti csv) memiliki banyak fungsi dan spesifikasi bawaan yang dapat membantu dalam kasus tertentu, namun hari ini saya ingin menunjukkan kepada Anda cara membuat file CSV sederhana Anda sendiri tanpa perlu menggunakan fungsi atau operasi mewah apa pun.

Sekarang, mari kita mulai.

Untuk konsistensi, mari buat tabel yang sama seperti yang kita lihat di atas. Mari kita uraikan masalahnya sebagai berikut:

  • Kita tahu bahwa setiap kolom dipisahkan dengan koma. Oleh karena itu, kita dapat menyusun data kita sebagai string Python, yang kolomnya dipisahkan dengan koma.
  • Kita tahu bahwa setiap baris dipisahkan oleh karakter baris baru. Oleh karena itu, kita dapat mendefinisikan string baru (dipisahkan dengan koma untuk kolomnya) untuk setiap baris.
  • Kita perlu menulis string ini ke dalam file. Python memiliki fungsi bawaan sederhana yang memungkinkan Anda menulis baris satu per satu ke dalam file — persis seperti yang kita butuhkan.

Mari lakukan ini selangkah demi selangkah. Pertama, mari kita definisikan semua string yang dipisahkan koma. Kami juga memasukkannya ke dalam daftar untuk memudahkan akses.

>>> header = 'name, age, color'
>>> row0 = 'Tom, 22, gold'
>>> row1 = 'Todd, 34, blue'
>>> row2 = 'Kelly, 21, green'
>>> row3 = 'Avril, 27, purple'
>>> data_list = [header, row0, row1, row2, row3]
>>> data_list
['name, age, color', 'Tom, 22, gold', 'Todd, 34, blue', 'Kelly, 21, green', 'Avril, 27, purple']

Sekarang, kita membuka file baru dalam mode “tulis” (artinya kita dapat menulis ke dalamnya). Sintaksnya adalah sebagai berikut (perhatikan jika Anda tidak menentukan jalurnya, jalur tersebut akan disimpan ke direktori yang sama dengan file Python Anda):

>>> my_file = open('data.csv', 'w')

Sekarang, kita dapat menulis baris kita ke dalam file satu per satu menggunakan kode berikut. Pastikan untuk mencatat bagaimana kita menulis karakter baris baru secara manual setelah setiap baris:

>>> for row in data_list:
...     my_file.write(row)
...     my_file.write('\n')
...
16
1
13
1
14
1
16
1
17
1

Angka-angka yang kita lihat tercetak adalah output dari fungsi write, yang mengembalikan jumlah karakter yang dikembalikan. Setelah selesai, kita perlu menutup file:

>>> my_file.close()

Dan voila! Sekarang, kita bisa membuka file ini di Excel, dan melihat tampilan yang sama seperti sebelumnya:

Pikiran Terakhir

Pada titik ini, Anda seharusnya memiliki gagasan yang kuat tentang bagaimana file CSV diformat, dan bagaimana Anda dapat mendefinisikannya secara manual dengan Python. Mampu melakukan ini sangat membantu saya dalam memformat dan memproses data saya, dan saya harap Anda juga demikian.

Sampai jumpa lagi, teman-teman!

Ingin unggul dalam Python? Dapatkan akses eksklusif dan gratis ke panduan saya yang sederhana dan mudah dibaca di sini.

Konten lainnya di . Daftar ke >kami. Ikuti kami di "Twitter" dan "LinkedIn". Bergabunglah dengan perselisihan komunitas kami.