У меня есть тысячи строк текста, где мне нужно найти деньги -представлениями т.д .:Python - Regex «Machine Learning»
Lorem ipsum dolor sit amet, 100.000,00 USD sadipscing elitr, sed diam nonumy eirmod
GBP 400 ut labore et dolore magna aliquyam erat, sed diam voluptua. At USD 20 eos et
accusam et justo duo dolores et 100,000.00 USD ea rebum. Stet 3,-- USD gubergren, no
питон скрипт должен вернуть сумму конвертирована в доллары США. (например, 100000USF, 400 GBP -> USD и т. д.)
То, что я делал до сих пор, вручную создавал регулярные выражения для чисел - комбинации валют, чтобы вернуть значение, затем сравнить валюту с базой данных и вычислить обмен.
Однако это не является ни эффективным, ни будущим доказательством (например, если добавлена другая валюта) Так что мне интересно, есть ли эффективный алгоритм машинного обучения, который я мог бы «обучать» примерами, а затем пытается найти sich "value - currency"?
будет ли денежная информация всегда представлена в виде пары единиц + единиц измерения, или вы хотите обрабатывать такие случаи, как: миллион долларов США? Если вы в первом случае, а ваши данные более или менее структурированы, тогда вам лучше пойти на регулярное выражение, иначе вам понадобится более продвинутая стратегия микшерного машинного обучения и обработка естественного языка ... – bendaizer