2013-08-01 6 views
0

У меня есть текстовый документ, включающий как китайский, так и английский. Я хотел бы разделить его на две части или два документа. Один документ просто удерживает китайскую часть, а другой документ содержит английскую часть. Есть ли способ сделать это на Java?Отдельная китайская часть и английская часть из текстового документа

+0

Что вы пробовали? Можете ли вы дать образец документа? Это файл '.doc' ... или' .pdf' или ..? –

ответ

0

Вы можете сделать с регулярным выражением, часть, которая проверяет шаблон с буквенным английским символом, переходите к части и части, которые не проверяются на другую часть. Я полагаю, что две части находятся в разных частях (не смешивая оба partd), возможно, если они смешаны, у вас может возникнуть проблема с обычными символами (,?? И т. Д.), Возможно, для этих персонажей вы могли видеть и следующий символ.

Я думаю, что это может быть возможно, вероятно, есть лучшие способы сделать это.

Редактировать: Я полагаю, что это txt, но в другом формате только передается в txt раньше.

Смежные вопросы