Я медсестра, и я знаю python, но я не эксперт, просто использовал его для обработки последовательностей ДНК.
Мы получили записи о больницах, написанные на человеческих языках, и я должен вставить эти данные в база данных или CSV-файл, но они более 5000 строк, и это может быть так сложно. Все данные записываются в последовательном формате, позвольте мне показать вам примерИзвлечение медицинской информации с использованием Python
11/11/2010 - 09:00am : He got nausea, vomiting and died 4 hours later
я должен получить следующие данные
Sex: Male
Symptoms: Nausea
Vomiting
Death: True
Death Time: 11/11/2010 - 01:00pm
Другой пример
11/11/2010 - 09:00am : She got heart burn, vomiting of blood and died 1 hours later in the operation room
И я получаю
Sex: Female
Symptoms: Heart burn
Vomiting of blood
Death: True
Death Time: 11/11/2010 - 10:00am
th e order не согласуется с тем, когда я говорю в ......., поэтому in - это ключевое слово, и весь текст после этого места, пока я не найду другое ключевое слово
В начале он или она определяет секс, получил ... ..... все, что следует, это группа симптомов, которые я должен разделить в соответствии с разделителем, который может быть запятой, гипной или чем-то другим, но он согласован для одной и той же линии.
умер ..... спустя несколько часов также должен быть много часов, иногда пациент остается жив и разряжен .... и т. д.
То есть у нас есть много соглашений, и я думаю, что если я смогу подделать текст с помощью ключевых слов и шаблонов, я смогу выполнить эту работу. Поэтому, пожалуйста, если вы знаете, полезную функцию/модули/учебник/инструмент для делать это желательно в Python (если не Python так инструмент графического интерфейса было бы неплохо)
Некоторые мало информации:
there are a lot of rules to express various medical data but here are few examples
- Start with the same date/time format followed by a space followd by a colon followed by a space followed by He/She followed space followed by rules separated by and
- Rules:
* got <symptoms>,<symptoms>,....
* investigations were done <investigation>,<investigation>,<investigation>,......
* received <drug or procedure>,<drug or procedure>,.....
* discharged <digit> (hour|hours) later
* kept under observation
* died <digit> (hour|hours) later
* died <digit> (hour|hours) later in <place>
other rules do exist but they follow the same idea
Это может быть полезно, если вы можете привести еще несколько примеров, в том числе тех, где существуют разные заказы, или когда пациент живет/выписан. – GWW
Есть ли список ключевых слов, которые являются допустимыми симптомами? Будут ли все записи начинаться с «он» или «она»? Все ли записи начинаются с даты/времени в том же формате? Если пациент выписан, будет ли в записи всегда слово «разряжено», а затем «х часов спустя»? – philosodad
ok Я добавил немного информации в нижней части вопроса. – Nurse