фонпреобразования большого текстового файла в базу данных
Я не программист или технический человек У меня есть проект, где мне нужно, чтобы преобразовать большой текстовый файл в базу данных доступа. Текстовый файл не находится в традиционном формате плоского файла, поэтому мне нужна предварительная обработка справки. Файлы большие (миллионы записей) между 100 МБ и 1 ГБ и, кажется, задыхаются от всех редакторов, которые я пробовал (блокнот, блокнот, vim, редактор em)
Ниже приведен пример исходного текста файл:
product/productId:B000H9LE4U
product/title: Copper 122-H04 Hard Drawn Round Tubing, ASTM B75, 1/2" OD, 0.436" ID, 0.032" Wall, 96" Length
product/price: 22.14
review/userId: ABWHUEYK6JTPP
review/profileName: Robert Campbell
review/helpfulness: 0/0
review/score: 1.0
review/time: 1339113600review/summary: Either 1 or 5 Stars. Depends on how you look at it.
review/text: Either 1 or 5 Stars. Depends on how you look at it.1 Star because they sent 6 feet of 2" OD copper pipe.0 Star because they won't accept returns on it.5 stars because I figure it's actually worth $12-15/foot and since they won't take a return I figure I can sell it and make $40-50 on this deal
product/productId: B000LDNH8I
product/title: Bacharach 0012-7012 Sling Psychrometer, 25?F to 120?F, red spirit filled
product/price: 84.99
review/userId: A19Y7ZIICAKM48
review/profileName: T Foley "computer guy"
review/helpfulness: 3/3
review/score: 5.0
review/time: 1248307200
review/summary: I recommend this Sling Psychrometer
review/text: Not too much to say. This instrument is well built, accurate (compared) to a known good source. It's easy to use, has great instructions if you haven't used one before and stores compactly.I compared prices before I purchased and this is a good value.
Каждая строка представляет определенный атрибут продукта, начиная с "продукта/ProductID:"
Что мне нужно
Мне нужно преобразовать это файл в поле с разделителями символов (я думаю, что работа с символом @), удаляя каждый из кодов (т. product/productId :, product/title :, и т. д., а также заменить на @ и заменить линии.
Я хочу, чтобы исключить обзор/текст: линия
Вывод будет выглядеть следующим образом:
[email protected] 122-H04 Hard Drawn Round Tubing, ASTM B75, 1/2" OD, 0.436" ID, 0.032" Wall, 96" [email protected]@[email protected] [email protected]/[email protected]@[email protected] 1 or 5 Stars. Depends on how you look at it.
[email protected] 0012-7012 Sling Psychrometer, 25?F to 120?F, red spirit [email protected]@[email protected] Foley "computer guy"@3/[email protected]@[email protected] recommend this Sling Psychrometer
[email protected] 0012-7012 Sling Psychrometer, 25?F to 120?F, red spirit [email protected]@[email protected] L. [email protected]/[email protected]@[email protected] very useful tool
теперь я бы плоский файл с разделителями с «@», что я могу легко импортировать в доступ.
Извините за бесплодие. Я открыт для предложений, но не понимаю программирования, достаточного для написания с использованием языка редактора. Заранее спасибо
Спасибо. Это та часть, с которой у меня проблемы. В редакторе я использую дроссели в файле, когда вручную пытаюсь выполнить поиск и замену текстовых строк и удалить строки. Я думал, что может быть какой-то способ написать простую программу (например, python или воспользоваться см., Но я не знаю, как это сделать). Смотрел какие-то рекомендации. – SDG