it-swarm-ru.tech

Как сравнить двоичные файлы в Linux?

Мне нужно сравнить два двоичных файла и получить вывод в виде:

<fileoffset-hex> <file1-byte-hex> <file2-byte-hex>

за каждый другой байт. Так что если file1.bin

  00 90 00 11

в двоичном виде и file2.bin

  00 91 00 10

Я хочу получить что-то вроде

  00000001 90 91
  00000003 11 10

Есть ли способ сделать это в Linux? Я знаю о cmp -l, но он использует десятичную систему для смещений и восьмеричную для байтов, которых я хотел бы избежать.

287
frustratedCmpNoLongerUser

Это выведет смещение и байты в шестнадцатеричном виде:

cmp -l file1.bin file2.bin | gawk '{printf "%08X %02X %02X\n", $1, strtonum(0$2), strtonum(0$3)}'

Или выполните $1-1, чтобы первое напечатанное смещение начиналось с 0.

cmp -l file1.bin file2.bin | gawk '{printf "%08X %02X %02X\n", $1-1, strtonum(0$2), strtonum(0$3)}'

К сожалению, функция strtonum() специфична для GAWK, поэтому для других версий awk, например mawk, вам потребуется использовать функцию преобразования восьмеричного значения в десятичное. Например,

cmp -l file1.bin file2.bin | mawk 'function oct2dec(oct,     dec) {for (i = 1; i <= length(oct); i++) {dec *= 8; dec += substr(oct, i, 1)}; return dec} {printf "%08X %02X %02X\n", $1, oct2dec($2), oct2dec($3)}'

Вычеркнуто для удобства чтения:

cmp -l file1.bin file2.bin |
    mawk 'function oct2dec(oct,    dec) {
              for (i = 1; i <= length(oct); i++) {
                  dec *= 8;
                  dec += substr(oct, i, 1)
              };
              return dec
          }
          {
              printf "%08X %02X %02X\n", $1, oct2dec($2), oct2dec($3)
          }'
167
Dennis Williamson

Как ~ шарлатан указал:

 % xxd b1 > b1.hex
 % xxd b2 > b2.hex

А потом

 % diff b1.hex b2.hex

или же

 % vimdiff b1.hex b2.hex
159
akira

diff + xxd

Попробуйте diff в следующей комбинации замещения процесса zsh/bash и colordiff в CLI:

diff -y <(xxd foo1.bin) <(xxd foo2.bin) | colordiff

Куда:

  • -y показывает различия между собой (необязательно)
  • xxd - это инструмент CLI для создания вывода hexdump двоичного файла
  • добавить -W200 к diff для более широкого вывода (по 200 символов в строке)

colordiff + xxd

Если у вас есть colordiff, он может раскрасить вывод diff, например:

colordiff -y <(xxd foo1.bin) <(xxd foo2.bin)

В противном случае установите через: Sudo apt-get install colordiff.

Пример вывода:

 binary file output in terminal - diff -y <(xxd foo1.bin) <(xxd foo2.bin) | colordiff

vimdiff + xxd

Вы также можете использовать vimdiff, например,.

vimdiff <(xxd foo1.bin) <(xxd foo2.bin)

Подсказки:

  • если файлы слишком велики, добавьте ограничение (например, -l1000) для каждой xxd
77
kenorb

Есть инструмент под названием DHEX , который может сделать эту работу, и есть другой инструмент под названием VBinDiff .

Для строго командной строки, попробуйте JDIFF .

52
njd

Метод, который работает для добавления/удаления байтов

diff <(od -An -tx1 -w1 -v file1) \
     <(od -An -tx1 -w1 -v file2)

Создайте тестовый пример с единственным удалением байта 64:

for i in `seq 128`; do printf "%02x" "$i"; done | xxd -r -p > file1
for i in `seq 128`; do if [ "$i" -ne 64 ]; then printf "%02x" $i; fi; done | xxd -r -p > file2

Результат:

64d63
<  40

Если вы также хотите увидеть версию символа ASCII:

bdiff() (
  f() (
    od -An -tx1c -w1 -v "$1" | paste -d '' - -
  )
  diff <(f "$1") <(f "$2")
)

bdiff file1 file2

Результат:

64d63
<   40   @

Проверено на Ubuntu 16.04.

Я предпочитаю od, чем xxd, потому что:

  • это это POSIX , xxd нет (поставляется с Vim)
  • имеет -An для удаления столбца адреса без awk.

Объяснение команды:

  • -An удаляет адресную колонку. Это важно, иначе все строки будут отличаться после добавления/удаления байта.
  • -w1 помещает один байт на строку, чтобы diff мог его использовать. Крайне важно иметь один байт на строку, иначе каждая строка после удаления окажется не в фазе и будет отличаться. К сожалению, это не POSIX, но присутствует в GNU.
  • -tx1 - это желаемое представление, замените его на любое возможное значение, пока вы сохраняете 1 байт на строку.
  • -v предотвращает повторение звёздочки *, которое может помешать diff
  • paste -d '' - - соединяет каждые две строки. Нам это нужно, потому что гекс и ASCII идут в отдельных соседних строках. Взято из: https://stackoverflow.com/questions/8987257/concatenating-every-other-line-with-the-next
  • мы используем скобки () для определения bdiff вместо {} для ограничения области действия внутренней функции f, см. также: https://stackoverflow.com/questions/8426077/how-to-define-a-function-inside-another -функция в bash

Смотрите также:

Короткий ответ

vimdiff <(xxd -c1 -p first.bin) <(xxd -c1 -p second.bin)

При использовании hexdumps и text diff для сравнения двоичных файлов, особенно xxd, добавления и удаления байтов становятся изменениями в адресации, что может затруднить просмотр. Этот метод говорит xxd не выводить адреса и выводить только один байт на строку, что, в свою очередь, показывает, какие именно байты были изменены, добавлены или удалены. Вы можете найти адреса позже, выполнив поиск интересных последовательностей байтов в более "нормальном" hexdump (вывод xxd first.bin).

13
Evgeny

Я бы порекомендовал hexdump для выгрузки двоичных файлов в текстовый формат и kdiff3 для просмотра различий.

hexdump myfile1.bin > myfile1.hex
hexdump myfile2.bin > myfile2.hex
kdiff3 myfile1.hex myfile2.hex
11
BugoK

hexdiff - это программа, разработанная специально для того, что вы ищете.

Использование:

hexdiff file1 file2

Он отображает шестнадцатеричный (и 7-битный ASCII) двух файлов один над другим с выделением любых различий. Посмотрите на man hexdiff команды для перемещения по файлу, и простая q закроется.

5
Mick

Возможно, он не совсем отвечает на вопрос, но я использую это для сравнения двоичных файлов:

gvim -d <(xxd -c 1 ~/file1.bin | awk '{print $2, $3}') <(xxd -c 1 ~/file2.bin | awk '{print $2, $3}')

Он печатает оба файла в шестнадцатеричном и ASCII значениях, по одному байту на строку, а затем использует средство сравнения Vim для визуальной визуализации.

3
John Lawrence Aspden

dhex http://www.dettus.net/dhex/

DHEX - это не просто еще один шестнадцатеричный редактор: он включает режим diff, который можно использовать для простого и удобного сравнения двух двоичных файлов. Поскольку он основан на ncurses и является темным, он может работать в любом количестве систем и сценариев. Благодаря использованию журналов поиска можно легко отслеживать изменения в разных итерациях файлов.

0
Vincent Vega

Вы можете использовать gvimdiff инструмент, который входит в vim-gui-common package

Sudo apt-get update

Sudo apt-get установить vim-gui-common

Затем вы можете сравнить 2 шестнадцатеричных файла, используя следующие команды:

ubuntu> gvimdiff <hex-file1> <hex-file2>

Это все. Надеюсь, что помощь!

0
craken