ruby 1.8.7 почему .to_yaml преобразует некоторые строки в нечитаемые байты

При анализе некоторых веб-страниц с помощью nokogiri у меня возникли проблемы при очистке некоторых строк и сохранении их с помощью YAML. Чтобы воспроизвести проблему, посмотрите на этот сеанс IRB, который воспроизводит ту же проблему:

irb(main):001:0> require 'yaml'
=> true
irb(main):002:0> "1,000 €".to_yaml
=> "--- !binary |\nMSwwMDAg4oKs\n\n"
irb(main):003:0> "1,0000 €".to_yaml
=> "--- \"1,0000 \\xE2\\x82\\xAC\"\n"
irb(main):004:0> "1,00 €".to_yaml
=> "--- !binary |\nMSwwMCDigqw=\n\n"
irb(main):005:0> "1 €".to_yaml
=> "--- !binary |\nMSDigqw=\n\n"
irb(main):006:0> "23 €".to_yaml
=> "--- !binary |\nMjMg4oKs\n\n"
irb(main):007:0> "12000 €".to_yaml
=> "--- !binary |\nMTIwMDAg4oKs\n\n"
irb(main):008:0> "1200000 €".to_yaml
=> "--- \"1200000 \\xE2\\x82\\xAC\"\n"
irb(main):009:0> "120000 €".to_yaml
=> "--- \"120000 \\xE2\\x82\\xAC\"\n"
irb(main):010:0> "12000 €".to_yaml
=> "--- !binary |\nMTIwMDAg4oKs\n\n"

Подводя итог, иногда выходные данные .to_yaml доступны для чтения, а в других случаях — нечитаемые. Самый интригующий аспект заключается в том, что струны очень похожи.

Как я могу избежать этих !binary... выходов?


person marcel massana    schedule 27.09.2011    source источник
comment
См. также stackoverflow.com/questions/9550330/.   -  person Eric Walker    schedule 09.07.2014


Ответы (1)


Предпочитает ли YAML выводить строку как текст или двоичный файл, это вопрос соотношения между символами ASCII и не ASCII.

Если вы хотите максимально избежать !binary, вам следует использовать гем ya2yaml. Он изо всех сил пытается сбросить строки, поскольку ASCII + экранировал UTF-8.

person gioele    schedule 29.09.2011