2013-05-21 3 views
1

Мне нужна помощь в написании Windows Batch Script. У меня есть текстовый файл Delimeted с данными, как показано ниже:Windows Batch script tp обрабатывает плоские файлы

1|2|3|4|5|6 
1|2|3|4|5|6 
1|2|3|4|5|6 
1|2|3|4|5|6 
1|2|3|4|5|6 
1|2|3|4|5|6. 

Я хочу, чтобы написать сценарий, где я могу редактировать этот текстовый файл, чтобы удалить первые и последнее поле данных. Так что текстовый файл вывод будет содержащим данные, как:

2|3|4|5 
2|3|4|5 
2|3|4|5 
2|3|4|5 
2|3|4|5 
2|3|4|5. 

Пожалуйста, помогите мне.

Заранее спасибо.

С уважением, Vibhor

+0

Каков период? Просто индикатор конца файла? или это действительно символ в файле? – dbenham

ответ

0

можно написать чисто пакетное решение, но написать надежное решение, которое может обрабатывать все, что вы бросаете на нее довольно сложно, и конечный результат будет медленным.

Это довольно легко выполнить задачу с JScript и регулярные выражения, но не каждый знает, что эти технологии (хотя, вероятно, более знающим JScript и регулярные выражения, чем знают партию!)

Я написал гибридную JScript/пакетная утилита REPL.BAT, которая легко вызывается из командной строки или из командного файла. Он выполняет поиск и замену регулярных выражений на stdin и записывает результат в stdout. Он работает на всех современных версиях Windows, начиная с XP.

Ваша задача легко и эффективно осуществляется с помощью REPL.BAT

Предполагая, что каждая строка имеет все 6 значений (пустые значения OK, но всегда имеет 5 разделителей):

type test.txt|repl "^[^|]*\|(.*)\|[^|]*$" "$1" >test.txt.new 
move /y test.txt.new test.txt 

Если некоторые линии отсутствуют (отсутствующие значения, которые считаются пустыми):

type test.txt|repl "(^[^|]*(\|[^|]*){4})\|[^|]*$" "$1"|repl "^[^|]*\|?(.*)$" "$1" >test.txt.new 
move /y test.txt.new test.txt 

Ниже приведена утилита REPL.BAT. Он должен быть помещен в ту же папку, что и ваш пакетный скрипт и файл, или еще лучше размещен в папке, которая находится в вашем PATH. В скрипт встроена полная документация.

@if (@X)==(@Y) @end /* Harmless hybrid line that begins a JScript comment 

::************ Documentation *********** 
::: 
:::REPL Search Replace [Options [SourceVar]] 
:::REPL /? 
::: 
::: Performs a global search and replace operation on each line of input from 
::: stdin and prints the result to stdout. 
::: 
::: Each parameter may be optionally enclosed by double quotes. The double 
::: quotes are not considered part of the argument. The quotes are required 
::: if the parameter contains a batch token delimiter like space, tab, comma, 
::: semicolon. The quotes should also be used if the argument contains a 
::: batch special character like &, |, etc. so that the special character 
::: does not need to be escaped with ^. 
::: 
::: If called with a single argument of /? then prints help documentation 
::: to stdout. 
::: 
::: Search - By default this is a case sensitive JScript (ECMA) regular 
:::   expression expressed as a string. 
::: 
:::   JScript regex syntax documentation is available at 
:::   http://msdn.microsoft.com/en-us/library/ae5bf541(v=vs.80).aspx 
::: 
::: Replace - By default this is the string to be used as a replacement for 
:::   each found search expression. Full support is provided for 
:::   substituion patterns available to the JScript replace method. 
:::   A $ literal can be escaped as $$. An empty replacement string 
:::   must be represented as "". 
::: 
:::   Replace substitution pattern syntax is documented at 
:::   http://msdn.microsoft.com/en-US/library/efy6s3e6(v=vs.80).aspx 
::: 
::: Options - An optional string of characters used to alter the behavior 
:::   of REPL. The option characters are case insensitive, and may 
:::   appear in any order. 
::: 
:::   I - Makes the search case-insensitive. 
::: 
:::   L - The Search is treated as a string literal instead of a 
:::    regular expression. Also, all $ found in Replace are 
:::    treated as $ literals. 
::: 
:::   B - The Search must match the beginning of a line. 
:::    Mostly used with literal searches. 
::: 
:::   E - The Search must match the end of a line. 
:::    Mostly used with literal searches. 
::: 
:::   V - Search and Replace represent the name of environment 
:::    variables that contain the respective values. An undefined 
:::    variable is treated as an empty string. 
::: 
:::   M - Multi-line mode. The entire contents of stdin is read and 
:::    processed in one pass instead of line by line.^anchors 
:::    the beginning of a line and $ anchors the end of a line. 
::: 
:::   X - Enables extended substitution pattern syntax with support 
:::    for the following escape sequences: 
::: 
:::    \\  - Backslash 
:::    \b  - Backspace 
:::    \f  - Formfeed 
:::    \n  - Newline 
:::    \r  - Carriage Return 
:::    \t  - Horizontal Tab 
:::    \v  - Vertical Tab 
:::    \xnn - Ascii (Latin 1) character expressed as 2 hex digits 
:::    \unnnn - Unicode character expressed as 4 hex digits 
::: 
:::    Escape sequences are supported even when the L option is used. 
::: 
:::   S - The source is read from an environment variable instead of 
:::    from stdin. The name of the source environment variable is 
:::    specified in the next argument after the option string. 
::: 

::************ Batch portion *********** 
@echo off 
if .%2 equ . (
    if "%~1" equ "/?" (
    findstr "^:::" "%~f0" | cscript //E:JScript //nologo "%~f0" "^:::" "" 
    exit /b 0 
) else (
    call :err "Insufficient arguments" 
    exit /b 1 
) 
) 
echo(%~3|findstr /i "[^SMILEBVX]" >nul && (
    call :err "Invalid option(s)" 
    exit /b 1 
) 
cscript //E:JScript //nologo "%~f0" %* 
exit /b 0 

:err 
>&2 echo ERROR: %~1. Use REPL /? to get help. 
exit /b 

************* JScript portion **********/ 
var env=WScript.CreateObject("WScript.Shell").Environment("Process"); 
var args=WScript.Arguments; 
var search=args.Item(0); 
var replace=args.Item(1); 
var options="g"; 
if (args.length>2) { 
    options+=args.Item(2).toLowerCase(); 
} 
var multi=(options.indexOf("m")>=0); 
var srcVar=(options.indexOf("s")>=0); 
if (srcVar) { 
    options=options.replace(/s/g,""); 
} 
if (options.indexOf("v")>=0) { 
    options=options.replace(/v/g,""); 
    search=env(search); 
    replace=env(replace); 
} 
if (options.indexOf("l")>=0) { 
    options=options.replace(/l/g,""); 
    search=search.replace(/([.^$*+?()[{\\|])/g,"\\$1"); 
    replace=replace.replace(/\$/g,"$$$$"); 
} 
if (options.indexOf("b")>=0) { 
    options=options.replace(/b/g,""); 
    search="^"+search 
} 
if (options.indexOf("e")>=0) { 
    options=options.replace(/e/g,""); 
    search=search+"$" 
} 
if (options.indexOf("x")>=0) { 
    options=options.replace(/x/g,""); 
    replace=replace.replace(/\\\\/g,"\\B"); 
    replace=replace.replace(/\\b/g,"\b"); 
    replace=replace.replace(/\\f/g,"\f"); 
    replace=replace.replace(/\\n/g,"\n"); 
    replace=replace.replace(/\\r/g,"\r"); 
    replace=replace.replace(/\\t/g,"\t"); 
    replace=replace.replace(/\\v/g,"\v"); 
    replace=replace.replace(/\\x[0-9a-fA-F]{2}|\\u[0-9a-fA-F]{4}/g, 
    function($0,$1,$2){ 
     return String.fromCharCode(parseInt("0x"+$0.substring(2))); 
    } 
); 
    replace=replace.replace(/\\B/g,"\\"); 
} 
var search=new RegExp(search,options); 

if (srcVar) { 
    WScript.Stdout.Write(env(args.Item(3)).replace(search,replace)); 
} else { 
    while (!WScript.StdIn.AtEndOfStream) { 
    if (multi) { 
     WScript.Stdout.Write(WScript.StdIn.ReadAll().replace(search,replace)); 
    } else { 
     WScript.Stdout.WriteLine(WScript.StdIn.ReadLine().replace(search,replace)); 
    } 
    } 
} 
0

попробовать sed из GnuWin

sed "s/^1|//;s/|6//" file 

или CMD оболочки:

for /f "tokens=2-6delims=|6" %a in (file) do @echo(%a^|%b^|%c^|%d%e 
Смежные вопросы