Поскольку я хочу извлечь текст из изображений (это выписка о банковской транзакции), что я успешно сделал. Но это дает мне необработанные данные. Не в структурированном формате, как показано на изображении.
Я пытался сделать это, играя с их вершинами. Но я только что нашел значение «описание» и «вершины» в формате списка. Как мне двигаться дальше, чтобы сохранить его в файле doc/txt в хорошо структурированном формате?
Мой код:
os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="C:\\Users\\...."
client = ImageAnnotatorClient()
list1=[]
list2=[]
def detect_text(Image_path):
with io.open(Image_path, 'rb') as image_file:
content = image_file.read()
image = vision.types.Image(content=content)
response = client.text_detection(image=image)
web_content = response.web_detection
web_content.best_guess_labels
texts = response.text_annotations
for text in texts:
#print (text)
for vertex in text.bounding_poly.vertices:
list1.append(vertex)
b=[text.description for text in texts]
list2=b[1:]
print(list2)
print(list1)
detect_text(Image_path)
Я получил вывод следующим образом:
['IDBI', 'BANK', 'Customer', 'ID'......]
[x: 229
y: 241
, x: 2331
y: 241
, x: 2331
y: 3350
, x: 229
...
...
]
Но ожидается: получить вывод в виде банковской выписки, похожей на то, что в структурированном формате. Который я могу плавно сохранить и отобразить в файле txt/doc