Вопросы по теме 'lexical-analysis'

Как реализовать двухпроходный сканер с помощью Flex?
В качестве домашнего проекта я хотел бы попытаться реализовать базовый язык моего собственного дизайна, который можно было бы использовать в качестве языка веб-сценариев. Запускать программу на C ++ как Apache CGI тривиально, поэтому настоящая работа...
1808 просмотров

Генераторы C#/.NET Lexer
Я ищу достойный генератор лексических сканеров для С#/.NET - что-то, что поддерживает категории символов Unicode и генерирует несколько читаемый и эффективный код. Кто-нибудь знает об одном? EDIT: мне нужна поддержка категорий Unicode , а...
6444 просмотров
schedule 23.03.2022

Текстовый анализ больших документов
У меня есть проект, в котором мне нужно сравнить документы, состоящие из нескольких глав, со вторым документом, чтобы определить их сходство. Проблема в том, что я понятия не имею, как это сделать, какие существуют подходы и есть ли у них какие-либо...
340 просмотров
schedule 27.12.2022

Анализ смысла текста
Я понимаю, что это обширная тема, но я ищу хороший учебник по синтаксическому анализу текста, в идеале на Python. В качестве примера того, что я собираюсь сделать, если пользователь напишет в блоге такую ​​запись: «Мэнни Рамирес возвращается...
12834 просмотров
schedule 17.06.2022

Установка flex (лексического анализатора) на Mac
Может кто-нибудь сказать мне, как я могу установить flex (лексический анализатор) на свой Mac? Я искал везде в Google, и я не могу найти его. У меня есть универсальный двоичный файл, и я извлек его на свой рабочий стол, но я понятия не имею, куда...
22487 просмотров
schedule 16.01.2023

Существует ли алгоритм, помогающий определить основную тему английского предложения?
Я пытаюсь выяснить, существует ли известный алгоритм, который может определить «ключевое понятие» предложения. Вариант использования следующий: Пользователь вводит предложение в виде запроса (курица на вкус похожа на индейку?) Наша система...
17408 просмотров
schedule 23.04.2022

Лексирование слов, разделенных пробелами, в ANTLR3, где некоторые слова являются ключевыми словами
Я работаю над проектом, который включает преобразование текста с тегами части речи в AST ANTLR3 с фразами в качестве узлов AST. Ввод в ANTLR выглядит так: DT-THE The NN dog VBD sat IN-ON on DT-THE the NN mat STOP . то есть (токен тега)+,...
189 просмотров
schedule 24.02.2022

Как вы анализируете контекстно-зависимый C-код?
Одна проблема, с которой я столкнулся, заключалась в том, что C должен быть контекстно-зависимым и не может анализироваться с помощью одного токена просмотра вперед. Например int main1; int main() {} Это самый простой пример, который я могу...
755 просмотров
schedule 31.08.2022

Использование lex и Yacc для синтаксического анализа php
Я хочу создать парсер php. я думал об использовании lex / yacc для этой задачи. Это хорошая идея ? или есть способы получше? где я могу найти уже сделанный lex / yacc для языка php. или хотя бы граммер?
1643 просмотров
schedule 10.03.2024

Что такое объектно-ориентированный сканер (лексический анализ)?
Недавно я столкнулся с концепцией лексического анализа под названием "объектно-ориентированный сканер", но я не смог отличить ее от обычной техники сканирования. Какие могут быть дополнительные вещи в объектно-ориентированном сканере, пожалуйста,...
584 просмотров

Синтаксический анализ и синтаксическое дерево
Я внедряю компилятор для школьного класса, и у меня есть некоторые проблемы с тем, как действовать дальше. Лексический анализ уже сделан. Для меня лексический анализ заключается в том, что у меня есть функция, которая возвращает объекты-токены, а...
805 просмотров

Как заставить парсер Coco/R не жадничать
Мой файл ATG определяет блок кода как Codeblock = "<#" {anychar} "#>" Когда парсер, сгенерированный Coco, натыкается на такой блок: <# a=5; print "Hello world!"; #> Жетон поднимается a=5; print "Hello Это...
328 просмотров

Эффективное различие между ключевым словом и идентификаторами
Я создаю компилятор и нахожусь в фазе лексического анализатора: Сначала установите зарезервированные слова в таблицу символов. Поле записи таблицы символов указывает, что эти строки никогда не являются обычными идентификаторами, и сообщает, какой...
351 просмотров

Анализ английских текстовых предложений для обнаружения рифм в PHP
Я не уверен, возможно ли это, но есть ли способ (предварительно написанная библиотека или известная схема научного обнаружения) проанализировать несколько предложений текста и определить, рифмуются ли предложения? Коллега предложил сравнить первое и...
1219 просмотров
schedule 31.07.2023

Написание транспилятора в точку, где происходит фактическое отображение
Я хочу понять, как работает транспиллер. Лучше всего это написать, конечно. Я искал несколько ресурсов, чтобы понять, как это работает теоретически. И я понимаю следующее: Насколько я понимаю, мне в основном нужно написать два класса:...
3133 просмотров

Настройка правил для Flex, предупреждение: правило не может быть сопоставлено
У меня есть эти гибкие правила: ^User-Agent: [^\n]*Firefox {useragent = TFIREFOX; } ^User-Agent: [^\n]*MSIE {useragent = TMSIE; } ^User-Agent: [^\n]*Opera {useragent = TOPERA; } ^User-Agent: [^\n]*Safari {guseragent = TSAFARI; } ... Я получаю...
2777 просмотров
schedule 14.05.2022

Проблема с использованием ввода-вывода C-файла с lex
Я реализую lex-версию простого сканера, который я написал на стандартном C . У меня возникли проблемы с тем, что ввод-вывод не ведет себя так, как я ожидаю в файле lex. fscanf не будет хранить строки и будет хранить целые числа как 0 в указанных...
299 просмотров
schedule 09.03.2022

Используйте разные парадигмы в одном и том же индексе
Я создаю словарь и хочу использовать elasticsearch в качестве поисковой системы. Он должен поддерживать несколько языков, поэтому моя база данных выглядит примерно так: | left_lang | right_lang | left_word | right_word | | de | en...
117 просмотров
schedule 28.07.2023

Что будет на выходе этой простой программы сразу после лексического анализа?
Для простой C программы, такой как: #include<stdio.h> int main(){ int first,second,sum; first = 10; second = 20; sum = first + second; printf("%d\n",sum); } что будет на выходе после первой фазы компиляции, которой...
203 просмотров

дизайн компилятора - лексический анализ: сколько столбцов занимает \t?
Я должен сохранить информацию о токене для моего лексического анализатора, например, его строку и столбец. Если я наткнусь на такой исходный код: \t \t int myInt; , как мне узнать столбец токена? Потому что я не знаю, сколько столбцов занимает \t....
187 просмотров