Split байтовой строки на байт (вместо Word8 или Char)

Я знаю, у меня уже есть функция Haskell Data.ByteString.Lazy разделить на CSV на один символ, например:Split байтовой строки на байт (вместо Word8 или Char)

split :: Word8 -> ByteString -> [ByteString]

Но я хотите разделить на несколько символов байтовой строки в (например, расщеплением на строку вместо Char):

split :: ByteString -> ByteString -> [ByteString]

у меня есть несколько символов разделителей в виде CSV-как текстовый файл, который мне нужно разобрать и индивидуальные сами символы появляются в некоторых полях, поэтому выбирая только один разделительный символ и отбрасывая rs будет загрязнять импорт данных.

У меня были некоторые идеи о том, как это сделать, но они кажутся взломанными (например, берут три Word8s, проверяют, являются ли они комбинацией разделителей, запускают новое поле, если они есть, рекурсируют дальше) и Думаю, я все равно изобрел колесо. Есть ли способ сделать это без восстановления функции с нуля?

источник

2009-09-09 Daniel Quinlan

Документация байтовых строк breakSubstring содержит функцию, которая делает то, что вы просите:

tokenise x y = h : if null t then [] else tokenise x (drop (length x) t) 
    where (h,t) = breakSubstring x y

источник

2009-09-09 11:24:18 sth

Хорошая функция там, прочитайте мой разум. Похоже, у нас есть консенсус 3 для breakSubstring, хотя мне все равно потребуется «toChunks» и «fromChunk» my ByteStrings для Stict ByteStrings и обратно, чтобы использовать это. Любая причина breakSubstring не в ByteString.Lazy? –

Есть несколько функций в байтовой строки для расщепления на подпоследовательности:

breakSubstring :: ByteString -> ByteString -> (ByteString,ByteString)

Там также байтовой строки-CSV пакет

, http://hackage.haskell.org/package/bytestring-csv
раскол пакет: http://hackage.haskell.org/package/split для строк, хотя.

источник

2009-09-09 10:48:36

я бы преобразовать ленивых байтовых строк строгих байтовых строк использовать breakSubstring, но, похоже, это может быть стоит Это. –

Похоже, breakSubstring не в GHC 6.8 libs ... это правильно? –

Split байтовой строки на байт (вместо Word8 или Char)

ответ

Смежные вопросы