2014-01-21 5 views
3

У меня есть функция python, которая должна читать данные из файла и разделить на два ключа и значение, а затем сохранить их в словаре. Пример: файла:Функция разделения Python. Слишком много значений для распаковки ошибки

http://google.com 2 
http://python.org 3 
# and so on a lot of data 

Я использую функцию разделения для него, но когда действительно есть много данных, что повышает ОШИБКУ

ValueError: too many values to unpack 

Что я могу сделать по этому поводу?

Это точный код, который не удается

with open(urls_file_path, "r") as f: 
    for line in f.readlines(): 
     url, count = line.split()# fails here 
     url_dict[url] = int(count) 
+5

Не могли бы вы показать точную строку кода, в которой эта ошибка возникает? – thefourtheye

+0

Вы делаете что-то неправильно. (Извините, но не видя, что вы делаете, я не могу дать лучший ответ.) – glglgl

+3

Это по сути означает, что вы не обрабатываете случаи, когда в строке ввода содержится более одного места. – gravetii

ответ

14

Вы пытаетесь разворачивать список раздвоение в этих двух переменных.

url, count = line.split() 

Что делать, если нет места или двух или более пробелов? Куда останутся остальные слова?

data = "abcd" 
print data.split() # ['abcd'] 
data = "ab cd" 
print data.split() # ['ab', 'cd'] 
data = "a b c d" 
print data.split() # ['a', 'b', 'c', 'd'] 

Вы можете фактически проверить длину до назначения

with open(urls_file_path, "r") as f: 
    for idx, line in enumerate(f, 1): 
     split_list = line.split() 
     if len(split_list) != 2: 
      raise ValueError("Line {}: '{}' has {} spaces, expected 1" 
       .format(idx, line.rstrip(), len(split_list) - 1)) 
     else: 
      url, count = split_list 
      print url, count 

с входного файла,

http://google.com 2 
http://python.org 3 
http://python.org 4 Welcome 
http://python.org 5 

Эта программа производит

$ python Test.py 
Read Data: http://google.com 2 
Read Data: http://python.org 3 
Traceback (most recent call last): 
    File "Test.py", line 6, in <module> 
    .format(idx, line.rstrip(), len(split_list) - 1)) 
ValueError: Line 3: 'http://python.org 4 Welcome' has 2 spaces, expected 1 

После @abarnert's comment, Вы можете использовать функцию partition как этого

url, _, count = data.partition(" ") 

Если есть более одного пространства/нет пространства, то count проведет оставшуюся часть строки или пустой строки, соответственно.

Если вы используете Python 3.x, вы можете сделать что-то вроде этого

first, second, *rest = data.split() 

Первые два значения будут назначены в first и second соответственно, а остальные части списка будут назначены rest , в Python 3.x

+1

Он также может захотеть 'url, count = line.split (None, 1)' (который будет обрабатывать любые дополнительные пробелы, сбросив их в 'count') или' url, _, count = line.partition ('') '(что будет делать аналогичным образом, но также не будет обрабатывать пробелы, оставив' count' пустым). Или он может просто захотеть поймать это исключение и повторно поднять более релевантный, потому что '' a b c d'' должен считаться ошибкой, но, надеюсь, более отлаживаемый. Или, может быть, ни один из вышеперечисленных; Трудно сказать, учитывая, что мы немного продолжаем ... – abarnert

+0

@abarnert Спасибо :) Я добавил метод 'partition' в ответ и поднял' ValueError' сейчас. – thefourtheye

+1

Обратите внимание, что он сейчас думает, что в его файле таких вещей не может быть, поэтому я бы посоветовал использовать метод, который громко жалуется на номер строки и данные на этой строке, а не на то, что просто проглатывает все молча. – RemcoGerlich

Смежные вопросы