У меня есть 2 текстовых файла. 1-й такой:
DB 41533499 41533500 14
CD 41533500 41533501 3
AR 41533504 41533505 5
DR 41533506 41533507 3
AR 41533508 41533509 1
AR 48743349 48743350 1
а 2-й выглядит так:
DB 41533400 41533600
DR 41533300 41533800
AR 41533200 41533800
AR 48743100 48743983
разница между 2-м и 3-м столбцами равна 1, что означает, что это точка. Я хотел бы создать новый файл, в котором 1-й столбец является общим для 2 файлов, а также диапазон 2-го и 3-го столбцов в файле 2 находится в диапазоне 2-го и 3-го столбцов в файле 2. вот ожидаемый результат:
DB 41533400 41533600 41533499 41533500 14
DR 41533300 41533800 41533506 41533507 3
AR 41533200 41533800 41533508 41533509 1
AR 48743100 48743983 48743349 48743350 1
Я пытаюсь сделать это в командной строке Linux и написал следующее, но не получил того, что хочу:
awk '{print $1 "\t" $2 "\t" $3 "\t" }' file2.txt '{print $1 "\t" $2 "\t" $3 "\t" $4 }' file1.txt > output.txt
Вы знаете, как это исправить?
AR 41533504 41533505 5
надо пропустить? - person RomanPerekhrest   schedule 14.12.2017AR 41533504 41533505
вписывается вAR 41533200 41533800
в файле2 на основе вашей объясненной логики. Возможно, есть еще одно ограничение, такое как уникальность? - person karakfa   schedule 14.12.2017