У меня есть старая клиентская база данных (.csv
) адресов. Самая большая проблема в том, что они несовместимы, и когда я их разделяю, муниципалитет находится либо в области, либо в городе, либо так далее... Пример:
(header) Country, Municipality, City, Detailed address(street name, number, floor, ap.)
**(proper) Count.xxxxxx, Mun.xxxxx, City.xxxx**
(case 1) Count.xxxxxx, City.xxxx, Mun.xxxxx
(case 2) Count.xxxxxx, City.xxxx, -Mun.xxxxx
(case 3) City.xxxx, Count.xxxxxx, Mun.xxxxx
(case 4) Mun.xxxxx, City.xxxx, Count.xxxxxx
(case 5) Mun.xxxxx, Count.xxxxxx, City.xxxx
«xxxx» = различные имена, содержит также цифры, пробелы и «.
Я попытался переупорядочить их все в следующем формате: Count.
,Mun.
,City.
, но все, что я видел и пробовал, было больше похоже на сортировку и фильтрацию.
Мне нужна помощь в изменении порядка, чтобы база данных была согласованной и все данные находились в соответствующем столбце.
более сложные примеры:
Страна, Район, Муниципалитет, Город, Подробный адрес улица/бульвар номер подъезд этаж кв. номер (Детальный адрес как бул. Болгария 100 подъезд А эт.4 кв.256)
Как вы можете себе представить, не все поля заполнены, а иногда поля не разделены "," (но это проблема, с которой мне придется смириться... не могу пройти через 65 тысяч строк...)
Count.xxxxx, Area.xx xxx, Munic.xxxxx, Cit.xxxxx, Addr.xxxxx
Area.xxxxx, Munic.xxxxx, Cit.xxxxx, Addr.xxxxx Munic.xxxxx, Cit.xxxxx,
Addr.xx xxx, Count.xxxxx Count.xxxxx, Munic.xxxxx, Cit.xxxxx, Addr.xxxxx
Munic.xxxxx, Vill.xxxxx Area.xxxxx, Addr.xxxxx Munic.xxxxx, Cit.xxxxx
Cit.xxxxx, Munic.xx xxx, Addr.xxx xx
а другое дело, что это мог быть и Город, и Деревня (ct. vill.)