Очистка изображения капчи и последующее использование Tesseract OCR (.NET)

Я имею дело с новым механизмом проверки изображения в моем очистка боте, после того, как я попробовал какое-то время с ImageMagick, с которым я более знаком, мне не повезло.

эти изображения капчи относятся к следующему типу: Text

и конкретные образцы:

Текст

Текст

Текст

после поиска решения для этих конкретных изображений капчи я нашел этот вопрос:

Очистка изображения с картинки

и есть фантастическое решение, предложенное Саймоном Мурье.

к сожалению, несмотря на то, что я использовал тот же точный код, я не получил таких же хороших чистых результатов:

Текст

Текст

Текст

Я оставил с сильными замаскированными линиями и несколькими точками время от времени, я подозреваю, что это связано с более новой версией OpenCvSharp, которую я в настоящее время должен использовать, поскольку та, которая использовалась во включенном решении в то время, устарела (я пытался добавить более старую версию из диапазона решений, но, вероятно, возникли конфликты и ошибки времени выполнения с моей текущей версией .net). теперь я использую пакеты OpenCvSharp4 и OpenCvSharp4.runtime.win Nuget.

Любые идеи о том, как получить такие же чистые результаты? или какие корректировки кода можно сделать для его достижения? Часть OCR, которую я уже реализовал, работает хорошо.

Спасибо!


person k-man    schedule 20.04.2020    source источник
comment
Я полагаю, что эта деятельность неэтична. Попытка обойти защиту CAPTCHA показывает неуважение к владельцу сервера, независимо от того, делают ли они это для защиты своей пропускной способности или своего бизнеса.   -  person fmw42    schedule 20.04.2020