Я не умею работать с файлом sdf

Мне дали для работы файл sdf. Файл содержит молекулы с их свойствами, и моя задача - найти их общее количество. До сих пор я работал только с файлами sql, которые запрашивал через pgadmin. Я должен сказать, что мой поиск в Google не был очень плодотворным, поскольку я пробовал онлайн-конвертеры, которые не работали, или сообщения в блогах, которые были слишком старыми, чтобы все еще работать.

Итак, мой вопрос в основном заключается в том, как кто-то работает с файлом sdf? Можно ли преобразовать его в файл дампа sql, чтобы я мог запросить его? Есть ли другой способ сделать это?

Заранее спасибо!


person Paschalis    schedule 07.01.2020    source источник
comment
Это помогает? stackoverflow.com/questions/1953248/   -  person VBoka    schedule 07.01.2020
comment
Сказал ли вам человек, который дал вам этот файл, что это? В приведенной выше ссылке есть несколько способов его открытия. Если вы попробуете, но это не сработает, пожалуйста, объясните, что вы пробовали и какое сообщение об ошибке получили.   -  person Nick.McDermaid    schedule 07.01.2020
comment
Хорошо, вам нужно выяснить, является ли это файлом данных SQL CE или файлом SDF, описанным ниже. Самый простой способ - открыть в блокноте. Если это чушь, это не тот файл, о котором идет речь ниже, и это может быть файл SQL CE. Но наверняка вы не получили этот файл, не имея представления о том, что это на самом деле?   -  person Nick.McDermaid    schedule 08.01.2020
comment
@VBoka Надеюсь, что на Chemistry Exchange вы нашли идеальное решение. Если вам удастся найти решение, не забудьте добавить гиперссылку в конце вашего вопроса. Это будет полезная перекрестная ссылка для тех, кто в будущем посетит stackoverflow. Всего наилучшего.   -  person Amit    schedule 09.01.2020


Ответы (1)


Если вы имеете дело с химическими структурами / биоинформатикой, то, скорее всего, ниже вы найдете ответ, который поможет вам начать.

Для получения дополнительной помощи я настоятельно рекомендую вам опубликовать вопрос на Chemistry Stackexchange (https://chemistry.stackexchange.com/).

Один файл MOL - это одна химическая структура. Например, бензойная кислота и ее файл MOL указаны ниже. введите здесь описание изображения  введите описание изображения здесь

Ознакомьтесь с анатомией файла MOL здесь. Как видите, это простой текстовый файл.

Теперь, когда вы знаете файл MOL, SDF (файл структурных данных) - это не что иное, как множество файлов mol, объединенных вместе. См. Ссылку здесь . Файл SDF также является файлом с открытым текстом.

Я думаю, будет сложно выровнять его с SQL, но как только вы поймете, что означает каждая строка файла SDF (и если в вашем файле SDF есть согласованный шаблон), вы сможете проанализировать его и сохранить в соответствующих столбцах SQL. .

Вы конвертируете весь файл как текст и сохраняете его, но я думаю, что осмысленный запрос будет трудным. Так что лучше разобрать.

Пожалуйста, дайте мне знать, если вам понадобится дополнительная помощь.

person Amit    schedule 07.01.2020
comment
Это ценная информация. OP пометил SDF (файл SQL CE). Казалось бы, этот файл не имеет ничего общего с этим и, вероятно, это тот файл, который вы упомянули. - person Nick.McDermaid; 08.01.2020
comment
@ Nick.McDermaid Спасибо - person Amit; 08.01.2020