Я пытаюсь выяснить, как наиболее эффективно искать строки в файле CSV с 23 миллионами строк в python.
Файл представляет собой список кодов ZIP + 4 и некоторую информацию о каждом, в основном их идентификатор FIPS, аббревиатуру штата и округ.
Например, строка 1 — {02468,1405,25,017,25017,MA,MIDDLESEX}, эти значения — {5_Dig_Zip,+4_Dig_Zip,StateFIPS,CountyFIPS,TotalFIPS,State_Abbrev,County}.
Я хотел бы создать словарь или какую-либо другую структуру данных, чтобы иметь возможность запрашивать:
data["02468"] --> и вернуть все строки, где 5-значный почтовый индекс равен 02468, или data["02468"]["1405"] и вернуть только эту строку.
Данные в настоящее время находятся в большом списке списков. Кажется, я хотел бы использовать вложенные словари, но я не совсем уверен, куда идти.
Спасибо!