it-swarm-ru.tech

Есть ли способ увидеть прогресс tar в каждом файле?

У меня есть пара больших файлов, которые я хотел бы сжать. Я могу сделать это, например, с

tar cvfj big-files.tar.bz2 folder-with-big-files

Проблема в том, что я не вижу никакого прогресса, поэтому я понятия не имею, сколько времени это займет или что-то в этом роде. Используя v, я могу, по крайней мере, видеть, когда каждый файл завершен, но когда файлов мало и они большие, это не самое полезное.

Есть ли способ получить tar, чтобы показать более детальный прогресс? Например, процент выполнения или индикатор выполнения или оставшееся время или что-то еще. Либо для каждого отдельного файла, либо для всех, либо для обоих.

117
Svish

Я предпочитаю oneliners, как это:

tar cf - /folder-with-big-files -P | pv -s $(du -sb /folder-with-big-files | awk '{print $1}') | gzip > big-files.tar.gz

Это будет иметь следующий результат:

4.69GB 0:04:50 [16.3MB/s] [==========================>        ] 78% ETA 0:01:21

Для OSX (из ответа Кендзи)

tar cf - /folder-with-big-files -P | pv -s $(($(du -sk /folder-with-big-files | awk '{print $1}') * 1024)) | gzip > big-files.tar.gz
91
checksum

Вы можете использовать pv для достижения этой цели. Чтобы правильно сообщить о прогрессе, pv нужно знать, сколько байтов вы на него бросаете. Итак, первым шагом является вычисление размера (в килобайтах). Вы также можете полностью сбросить индикатор выполнения и просто позволить pv сказать вам, сколько байтов он видел; это сообщило бы: «сделано так много и так быстро».

% SIZE=`du -sk folder-with-big-files | cut -f 1`

А потом:

% tar cvf - folder-with-big-files | pv -p -s ${SIZE}k | \ 
     bzip2 -c > big-files.tar.bz2
73
akira

лучше прогресс бар ..

apt-get install pv dialog

(pv -n file.tgz | tar xzf - -C target_directory ) \
2>&1 | dialog --gauge "Extracting file..." 6 50

enter image description here

22
Mr. Black

Проверьте параметры --checkpoint и --checkpoint-action на странице информации о tar (что касается моего дистрибутива, описание этих параметров не содержится на странице man → RTFI).

См. https://www.gnu.org/software/tar/manual/html_section/tar_26.html

С их помощью (и, возможно, с функциональностью, чтобы написать свою собственную команду контрольной точки), вы можете рассчитать процент ...

15
helper

Вдохновленный ответом помощника

Другой способ - использовать нативные опции tar

FROMSIZE=`du -sk ${FROMPATH} | cut -f 1`;
CHECKPOINT=`echo ${FROMSIZE}/50 | bc`;
echo "Estimated: [==================================================]";
echo -n "Progess:   [";
tar -c --record-size=1K --checkpoint="${CHECKPOINT}" --checkpoint-action="ttyout=>" -f - "${FROMPATH}" | bzip2 > "${TOFILE}";
echo "]"

результат как

Estimated: [==================================================]
Progess:   [>>>>>>>>>>>>>>>>>>>>>>>

полный пример здесь

8
campisano

Просто заметил комментарий о MacOS, и хотя я думаю, что решение от @akira (и pv) - это много аккуратнее, я подумал, что я поймал догадку и быструю игру в моей коробке MacOS с tar и отправил бы ей SIGINFO сигнал. Как ни странно, это сработало :), если вы работаете в BSD-подобной системе, это должно работать, но на Linux-коробке вам может понадобиться отправить SIGUSR1, и/или tar может работать не так ,.

Недостатком является то, что он предоставит вам только вывод (на стандартный вывод), показывающий, как далеко находится текущий файл, так как я предполагаю, что он понятия не имеет, насколько велик поток данных, который он получает.

Так что да, альтернативный подход - запускать tar и периодически отправлять SIGINFO каждый раз, когда вы хотите узнать, как далеко он продвинулся. Как это сделать?

Специальный ручной подход

Если вы хотите иметь возможность проверять статус на специальной основе, вы можете нажать control-T (как упомянул Брайан Свифт) в соответствующем окне, которое отправит сигнал SIGINFO. Я полагаю, что проблема в том, что он отправит его всей вашей цепочке, так что если вы делаете:

% tar cvf - folder-with-big-files | bzip2 -c > big-files.tar.bz2

Вы также увидите bzip2 отчет о его статусе вместе с tar:

a folder-with-big-files/big-file.imgload 0.79  cmd: bzip2 13325 running 
      14 0.27u 1.02s 

      adding folder-with-big-files/big-file.imgload (17760256 / 32311520)

Это хорошо работает, если вы просто хотите проверить, зависает ли запущенная вами tar или просто медленная. В этом случае вам, вероятно, не нужно слишком беспокоиться о проблемах форматирования, так как это всего лишь быстрая проверка.

Этакий автоматизированный подход

Если вы знаете, что это займет некоторое время, но хотите что-то вроде индикатора прогресса, альтернативой может быть запуск вашего процесса tar, а в другом терминале определить его PID, а затем выбросить его в скрипт, который просто несколько раз посылает сигнал через , Например, если у вас есть следующий скриптлет (и вызовите его, как, скажем, script.sh PID-to-signal interval-to-signal-at):

#!/bin/sh

PID=$1
INTERVAL=$2
SIGNAL=29      # excuse the voodoo, bash gets the translation of SIGINFO, 
               # sh won't..

kill -0 $PID   # invoke a quick check to see if the PID is present AND that
               # you can access it..

echo "this process is $$, sending signal $SIGNAL to $PID every $INTERVAL s"
while [ $? -eq 0 ]; do
     sleep $INTERVAL;
     kill -$SIGNAL $PID;    # The kill signalling must be the last statement
                            # or else the $? conditional test won't work
done
echo "PID $PID no longer accessible, tar finished?"

Если вы вызываете его таким образом, поскольку вы нацеливаетесь только на tar, вы получите более похожий результат

a folder-with-big-files/tinyfile.1
a folder-with-big-files/tinyfile.2
a folder-with-big-files/tinyfile.3
a folder-with-big-files/bigfile.1
adding folder-with-big-files/bigfile.1 (124612 / 94377241)
adding folder-with-big-files/bigfile.1 (723612 / 94377241)
...

что я признаю, это довольно мило.

И последнее, но не менее важное - мои скрипты довольно ржавые, поэтому, если кто-то захочет пойти и почистить/исправить/улучшить код, продолжайте свою жизнь :)

3
tanantish

Использование только tar

tar имеет опцию (начиная с v1.12) для печати информации о состоянии сигналов, используя --totals=$SIGNO, например

tar --totals=USR1 -czf output.tar input.file
Total bytes written: 6005319680 (5.6GiB, 23MiB/s)

Информация Total bytes written: [...] печатается на каждом сигнале USR1, например:

pkill -SIGUSR1 tar

Источник:

2
Murmel

Вдохновленный ответ Ноа Спурриера

function tar {
  local bf so
  so=${*: -1}
  case $(file "$so" | awk '{print$2}') in
  XZ) bf=$(xz -lv "$so" |
    Perl -MPOSIX -ane '$.==11 && print ceil $F[5]/50688') ;;
  gzip) bf=$(gzip -l "$so" |
    Perl -MPOSIX -ane '$.==2 && print ceil $F[1]/50688') ;;
  directory) bf=$(find "$so" -type f | xargs du -B512 --apparent-size |
    Perl -MPOSIX -ane '$bk += $F[0]+1; END {print ceil $bk/100}') ;;
  esac
  command tar "[email protected]" --blocking-factor=$bf \
    --checkpoint-action='ttyout=%u%\r' --checkpoint=1
}

Источник

2
Steven Penny

Если вы знаете номер файла вместо общего размера всех из них:

альтернатива (менее точная, но подходящая) заключается в использовании опции -l и отправке в канале unix имен файлов вместо содержимого данных.

Давайте поместим 12345 файлов в mydir , команда:

[[email protected] mydir]$ tar cfvz ~/mytarfile.tgz .|pv -s 12345 -l > /dev/null 

вы можете знать это значение заранее (из-за вашего варианта использования) или использовать какую-то команду, например find + wc , чтобы обнаружить это:

[[email protected] mydir]$ find | wc -l
12345
1
bzimage

Метод основан на tqdm :

tar -v -xf tarfile.tar -C TARGET_DIR | tqdm --total $(tar -tvf tarfile.tar | wc -l) > /dev/null
0
J_Zar