Как я могу получить вектор из сохраненного текстового файла вектора?

Я уже обучил модель с помощью Word2vec в Python и сохранил вектор (размер которого = 300), соответствующий всем этим словам, как в файле vec.txt, теперь, если у меня есть одно слово, которое мне нужно, чтобы получить соответствующие векторы и сделать некоторые aclatue для этих векторов. Но я не знаю, как получить эти векторы из txt-файла.
Следующие части являются частью vec.txt:

если я получил «новое», мне нужно получить 300 соответствующих векторов для нового из файла vec.txt.

Вы можете прочитать файл, разбить его на пробелы, удалить первое слово («новое») и преобразовать полученные 300 строк в числа с плавающей запятой.


person Community    schedule 06.08.2015    source источник
comment
Привет, могу я задать вам один вопрос, у меня нет доступа, чтобы задать новый вопрос здесь, я могу только добавлять комментарии, если вы можете ответить на мой вопрос, я буду признателен за это. здесь я получил список k: k = [[u'水果'], [u'饮品'], [], [u'牛小排'], [u'香\ u828b'], [u'慕斯'], [u'快餐'], [u'椰子' u'土司']] умеете ли вы удалять пустые [] элемент в k, вы можете видеть, что в списке есть один пустой [].   -  person kvorobiev    schedule 06.08.2015


Ответы (1)


Пожалуйста, предоставьте свой код и пример файла

with open('vec.txt') as f:
   file_string = f.read().strip()
   numbers = [float(s) for s in file_string.split()[1:]]
   print numbers
.

with open('vec.txt') as f:
   file_string = f.read().strip()
   numbers = [float(s) for s in file_string.split()[1:]]
   print numbers
person Jakube    schedule 06.08.2015
comment
filter = [элемент для элемента в k, если k=='']? мне нужно вернуть k = [[u'水果'], [u'饮品'], [u'牛小排'], [u'香芋']], который удалили [] - person ; 21.08.2015
comment
@ ArrayNo1 Извините, я ошибся. Должно быть: _1_. Проверьте это здесь: ideone.com/NX9awX - person ; 21.08.2015
comment
Кстати, это понимание списка вызовов. Вы должны прочитать о них. Они супер легкие и очень полезные. - person Jakube; 21.08.2015
comment
спасибо~~!! очень много - person Jakube; 21.08.2015
comment
это работает, большое спасибо. Я трачу время на сортировку для k = [[[u'咖啡'], 0,045930384670007499], [[u'巧克力'], -0,068261551870430676], [[u'水果' ], 0,0070263516632489802], [[u'水果'], 0,0070263516632489802], [[u'水果', u'蛋糕'], 0,030538705507c\uc\ud5c\ud5'32], [[ub ], 0.038854468196036926], [[u'奶油'], -0.072265207412896187], [[u'奶油'], -0.072265207412896187]] вторым элементом этого списка (это числа), но это не работает, когда я печатаю (k [1]), он печатает второй элемент списка, хотя я - person ; 21.08.2015
comment
Хотя я должен печатать все числа в списке, а не [u'巧克力'], -0,068261551870430676], - person ; 21.08.2015
comment
Нет, _1_ печатает только второй элемент в списке. _2_, _3_, ... дает вам то, что вы хотите. И если вам нужен второй элемент каждого элемента в _4_, вы можете сделать это снова со списками: _5_. - person ; 21.08.2015
comment
Благодарность ! Теперь я это знаю. это тоже работает - person Jakube; 21.08.2015
comment
извините, могу я задать вам последний вопрос, UnicodeEncodeError: кодек 'gbk' не может кодировать символ u'' в позиции 0: недопустимая многобайтовая последовательность, есть проблема с декодированием - person ; 21.08.2015
comment
@ArrayNo1 понятия не имею, может быть, попробуйте что-то вроде этого: stackoverflow.com/questions/3218014/ - person ; 21.08.2015
comment
Спасибо за помощь и время~ - person Jakube; 21.08.2015
comment
Привет, спасибо за всю вашу помощь, и мне интересно, если вы знаете: такая ситуация, когда используется обученная модель для проверки данных, убедитесь, что входные данные не проблема, но программа работает все время, а не останавливается, и не показывая никакой ошибки назад говорит, что это неправильно или что-то в этом роде, просто работает все время, и в выходном файле тоже ничего не печатается. - person ; 21.08.2015
comment
new -0.000113 0.000211 -0.000170 0.000346 -0.000251 -0.001012 0.001647 -0.001331 0.001267 0.000876 0.001243 -0.000600 -0.000667 -0.001241 0.001204 -0.000726 -0.001023 0.001476 -0.001380 0.000065 0.000145 0.001451 0.001275 0.001482 -0.001011 0.001131 0.001095 -0.001637 0.000289 -0.000846 0.001599 -0.001027 -0.000768 -0.000595 0.000825 0.000639 -0.001097 -0.001654 -0.000977 -0.000351 0.001410 0.001182 0.000318 -0.000454 -0.000622 0.000343 0.000508 -0.000258 0.001347 0.000362 0.000372 -0.000208 0.000896 0.001408 0.001412 -0.001566 0.001642 -0.000865 -0.000656 0.001095 -0.001503 -0.000483 0.000465 0.001352 0.000602 -0.000017 0.000011 0.001219 0.001363 0.001296 -0.000474 0.000718 -0.000544 0.000779 -0.001225 -0.001141 -0.001061 -0.000550 0.001446 0.000735 0.001267 0.001269 0.001115 0.001023 0.001564 -0.000947 0.000320 -0.001648 0.001605 -0.000900 -0.000734 -0.000344 0.000376 -0.001550 0.001241 0.000294 0.000207 -0.001420 0.000297 0.001122 0.000834 -0.001423 -0.001499 0,001060 0,000898 0,001 609 -0.000512 -0.001185 -0.001648 0.001328 0.001620 0.001344 0.000160 0.000567 -0.001665 -0.000246 -0.000274 0.001234 0.000659 0.000144 -0.001370 0.001457 -0.000025 0.001117 0.000249 0.000137 -0.000048 -0.000527 -0.000428 0.000305 -0.001058 0.001374 0.000369 0.001588 0.000085 0.000749 -0.001584 0.000918 -0.001196 0.000424 0.000651 -0.001387 0.000815 -0.000959 0.001261 ​​-0.001246 0.000258 -0.000887 0.001583 0.000102 -0.001337 0.000428 -0.000004 0.000131 0.000487 -0.001659 0.000093 0.001464 0.000356 -0.001479 -0.001217 -0.000626 0.001019 0.001179 -0.000599 0.000825 0.000858 -0.000841 0.000399 -0.001587 -0.000923 -0.000496 -0.000668 0.000567 0.001308 0.001042 -0.000676 0.001292 -0.001345 0.000113 0.000021 -0.000577 0.000292 0.001052 -0.001646 -0.001186 0.000184 0.000747 -0.001190 -0.001472 0.000535 0.000199 0.000522 -0.000229 -0.000277 -0.000136 0.001568 -0.000509 -0.000065 0.000305 0.001245 -0.001371 -0.001378 -0.000742 0.000411 -0.000461 0.001547 0.001272 0.001339 0,000181 -0,001335 0,00 0257 -0.000001 0.001494 -0.001379 -0.000635 -0.001195 -0.001483 0.000744 -0.000203 0.000407 -0.000061 -0.001561 0.000239 0.000370 0.000227 -0.000043 -0.001377 -0.000961 -0.001038 0.001575 0.000618 0.000218 0.001260 0.000971 0.000572 0.001307 0.000362 -0.000844 -0.000281 0.000440 -0.001122 0.000097 0.001392 0.000427 0.000913 -0,000537 -0,000889 0,000799 -0,001422 0,001501 0,001130 -0,000633 -0,000747 0,001198 0,000235 0,001335 0,000273 -0,000906 -0,07 0,05 0,0005051 001294 0.000451 -0.001180 -0.001376 0.000287 0.001508 0.000068 0.000225 0.000504 0.000137 -0.001071 -0.001383 0.001414 -0.000946 0.001358 -0.001146 -0.000623 0.000656 0.001605 0.000519 0.000106 0.001341 -0.000560 -0.001359 0.000721 ​​0.001653 -0.000643 0.000625 0.000133 -0.000321 0.001230 0.000046 -0.001030 0.000752 0.000108 0.001263 0.000562 0.001224 - person ; 22.08.2015