А почему шелл мне так уродует русские буквы?
?%90?%81бол_(а?%81?%82?%80ологи?%87е?%81 кий_?%81имвол).gif
Убунта, разные версии пробовал. Полный вывод внутри.

Tagged with →  

27 Responses to А почему шелл мне так уродует русские буквы?

  1. Tfoenko:

    $ wget «http://upload.wikimedia.org/wikipedia/ru…» —21:00:31 — http://upload.wikimedia.org/wikipedia/ru…
    => `?%90?%81бол_(а?%81?%82?%80ологи?%87е?%8 1кий_?%81имвол).gif.1′
    Преобразование адреса upload.wikimedia.org… 91.198.174.234
    Устанавливается соединение с upload.wikimedia.org|91.198.174.234|:80& #133; соединились.
    Запрос HTTP послан, ожидание ответа… 200 OK
    Длина: 206 [image/gif]

    100%[=================================== ======================================== ======================================>] 206 —.—K/s

    21:00:31 (16.64 MB/s) — `?%90?%81бол_(а?%81?%82?%80ологи?%87е?%8 1кий_?%81имвол).gif’ сохранён [206/206]

  2. Tfoenko:

    : парсер лох, но понятно, что имена файлов у меня получаются немного не такие, как надо…

  3. V-nFcuk:

    ты про tty1..6? там надо шрифт просто поменять. а вообще эта проблема уже была решена в новых версиях — там искаропки красивые шрифты в текстовой камсоли

  4. V-nFcuk:

    Stephan-V: олсо, задавая вопрос тут, тебе не избежать моей фразы «пришло время выкинуть протухшую ubuntu 8.04» :3

  5. Tfoenko:

    Stephan-V: Stephan-V: нет, это безотносительно tty, это и в красивом окошке терминала, и в скриптах с перенаправленным выводом (совсем без терминала).

    И в свежей убунте тоже ж.

  6. Tfoenko:

    Если адрес задавать в виде
    http://upload.wikimedia.org/wikipedia/ru…
    то тоже сохраняет в файл с кривым именем.

    Это не проблема wget — другие консольные утилиты ведут себя так же.

  7. Tfoenko:

    : парсер опять лох. url я имел в виду без символов юникода, а урл-закодировано с процентами

  8. RARSpb:

    : какие другие?

  9. RARSpb:

    Да, у меня с конкретно вгетом и конкретно этим урлом аналогично.

    И что?

  10. Tfoenko:

    : то есть всё ок?

  11. Tfoenko:

    : xalan, к примеру

  12. Tfoenko:

    Stephan-V: специально проверил — в 12.04 другой разрядности — то же самое.

  13. RARSpb:

    : примеры давай

  14. RARSpb:

    : я не говорю что совсем всё ок, я говорю что я раньше об этом не знал и никаких проблем не имел

  15. Tfoenko:

    :
    cat filelist | xargs -I ‘{}’ xalan -xsl 1.xsl -in ‘{}’ -out ‘{}’.transformed

    в результате получаю файлы с повреждёнными названиями
    думаю, что проблема в шелле
    как видишь, это воспроизводится

  16. RARSpb:

    : как минимум в случае wget никакой шелл никакого участия в создании файла не принимает

  17. Tfoenko:

    : логично. в чём же тогда дело?

  18. Tfoenko:

    : я давно заметил, но неудобства начал испытывать недавно

  19. RARSpb:

    : это проблема wget:

    ‘—restrict-file-names=modes’

    If you specify ‘nocontrol’, then the escaping of the control characters is also switched off. This option may make sense when you are downloading URLs whose names contain UTF-8 characters, on a system which can save and display filenames in UTF-8 (some possible byte values used in UTF-8 byte sequences fall in the range of values designated by Wget as “controls”).

  20. Tfoenko:

    : ох! спаситель наш )
    с —restrict-file-names=nocontrol теперь всё ок.
    Странные у него представления о том, что нужно экранировать.
    Экспериментирую дальше.

  21. Yb_RU:

    Это не проблема shell, это wget так делает
    Допустим вот так файл создаст ИМЕННО shell:
    $curl ‘http://upload.wikimedia.org/wikipedia/ru… > ‘Асбол_(астрологический_символ).gif’
    и имя будет корректным при
    $echo $LANG
    ru_RU.UTF-8

  22. Yb_RU:

    curl —remote-name ‘http://upload.wikimedia.org/wikipedia/ru…
    тоже «не портит», проблема конкретной версии (или всех версий) wget.
    Shell тут не при чом.

  23. RARSpb:

    : комменты не читай, сразу отвечай

  24. Tfoenko:

    : ну дак по делу же.
    это я «ман не читай, сразу вопрошай» ))

  25. Yb_RU:

    : Коменты я прочитал, там мутно отвечено про wget, но не отвечено про шел. Я как раз-то и показал что это не проблема шела вообще.

  26. RARSpb:

    : ок, мутно так мутно

  27. Tfoenko:

    Вот для чего был вопрос, кстати
    http://kartz.ru/2012/07/11/download-all-…

Добавить комментарий