У нас есть сгенерированные пользователем имена работодателей во всех вариациях. Например, люди ввели или импортировали:
Google
Google, Inc.
Google Inc.
Google Inc.
Для поиска в базе данных это выглядит как другая компания. Мы изменили некоторые вещи, чтобы сопоставить каждого работодателя с «нормализованным» именем, но с общим количеством 70 000 становится трудно сделать это вручную.
Есть ли у кого-нибудь предложения о том, как нормализовать существующие записи, а также как сделать это и для всех входящих имен?