Учитывая, что ConQat плохо справляется с COBOL, вы можете изучить наш инструмент CloneDR.
У него есть версия, которая явно работает с IBM Enterprise COBOL, используя точный синтаксический анализатор, и правильно обрабатывает всю эту бессмыслицу с порядковыми номерами. (Он даже будет читать код COBOL в своем собственном ECBDIC, что означает, что буквальная строка, содержащая символ новой строки ASCII, не нарушает синтаксический анализатор). [Если ваш COBOL не является IBM COBOL, это вам не поможет, но в противном случае вам не «придется тратить много часов, чтобы что-то получить»].
Мы думаем, что метод обнаружения на основе AST обнаруживает лучшие клоны более точно, чем обнаружение на основе токенов ConQat. Сайт подробно объясняет, почему, и показывает образцы клонов COBOL, обнаруженных с помощью CloneDR.
Специально для OP, который, похоже, работает в Японии: в качестве бонуса CloneDR обрабатывает японские наборы символов, потому что он реализован поверх базовая инфраструктура инструмента, поддерживающая Unicode и Shift-JIS. У нас не было большого опыта работы с японским COBOL, так что может остаться глюк; см. литералы G с японскими символами.
person
Ira Baxter
schedule
26.06.2012