это больше теоретический вопрос
всякий раз, когда я ищу в Интернете для извлечения признаков и сопоставления признаков, единственные результаты, которые я получаю, касаются объектов изображения... например, нахождения лица или узорчатой подушки и т. д..
но то, чего я пытаюсь достичь, - это хорошее сопоставление функций (или извлечение) с веб-сайтов. Это означает, что я сосредоточиваюсь на важных объектах на веб-сайтах, плюс сопоставление, скорее всего, будет между панелями, таблицами или изображениями (изображения наименее вероятны)
использование opencv ORB или SIFT не дает мне очень хороших результатов, вот код, который я использовал:
def feature_matching2(fp1, fp2, num_of_matches):
image1 = cv2.imread(fp1, 0)
image2 = cv2.imread(fp2, 0)
orb = cv2.ORB()
kp1, des1 = orb.detectAndCompute(image1, None)
kp2, des2 = orb.detectAndCompute(image2, None)
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
matches = bf.match(des1, des2)
matches = sorted(matches, key=lambda x: x.distance)
image3 = cv2.drawMatches(image1, kp1, image2, kp2, matches[:num_of_matches])
plt.imshow(image3)
plt.show()
return sum([match.distance for match in matches[:num_of_matches]])
Итак, еще раз, в основном то, что я ищу, это: 1. способ извлечения важных функций/объектов из снимка экрана веб-сайта 2. алгоритм сопоставления функций, который подходит для больших изображений, содержащих текст.
*изменить* идея состоит в том, чтобы сделать скриншот двух веб-сайтов и сравнить их функции, вообще не используя HTML
благодарю вас