Я считаю, что функция Ruby's each
немного запутанна. Если у меня есть строка текста, цикл each
даст мне каждое слово с разделителями пространства, а не каждый отдельный символ.Как разобрать строку с текстом в Ruby?
Так какой лучший способ получить разделы строки, которые ограничены символом табуляции. На данный момент у меня есть:
line.split.each do |word|
...
end
, но это не совсем правильно.
Это нормально для простых корпусов. Но это не так просто. Существует ряд крайних случаев, когда контент поступает из внешнего источника. Новые строки, escape-последовательности, кавычки и т. Д. Настолько различны между различными приложениями. –