2011-10-18 2 views
1

Я пытаюсь захватить изображения во встроенной электронной почте. Проблема в том, что изображение, которое я сохраняю, не читается, и я не могу понять, почему. электронной почты (сохраняется в виде файла, который я загружаю в начале кода):Сохранение встроенных изображений в сообщениях электронной почты с помощью python

MIME-Version: 1.0 

Received: by 10.100.120.7 with HTTP; Tue, 18 Oct 2011 10:36:48 -0700 (PDT) 

In-Reply-To: <[email protected]e.com> 

References: <[email protected]e.com> 

Date: Tue, 18 Oct 2011 19:36:48 +0200 

Delivered-To: [email protected] 

Message-ID: <[email protected]om> 

Subject: openme 

From: Simeon Shpiz <[email protected]> 

To: me <[email protected]> 

Content-Type: multipart/related; boundary=001636c5977303b92404af962ba6 



--001636c5977303b92404af962ba6 

Content-Type: multipart/alternative; boundary=001636c5977303b91d04af962ba5 



--001636c5977303b91d04af962ba5 

Content-Type: text/plain; charset=ISO-8859-1 



**** 



--001636c5977303b91d04af962ba5 

Content-Type: text/html; charset=ISO-8859-1 

Content-Transfer-Encoding: quoted-printable 



<div dir=3D"ltr"><div class=3D"gmail_quote"><div lang=3D"EN-US" link=3D"blu= 

e" vlink=3D"purple"><div><p class=3D"MsoNormal"><span style=3D"font-size:11= 

.0pt;color:#1F497D"><img width=3D"15" height=3D"13" src=3D"cid:image003.png= 

@01CC8DCD.30A2A7C0"></span><span style=3D"font-size:11.0pt;color:#1F497D"><= 

u></u><u></u></span></p> 



</div> 

</div></div><br></div> 



--001636c5977303b91d04af962ba5-- 

--001636c5977303b92404af962ba6 

Content-Type: image/png; name="image003.png" 

Content-Transfer-Encoding: base64 

Content-ID: <[email protected]> 

X-Attachment-Id: 3e79c375acccec3d_0.1 



iVBORw0KGgoAAAANSUhEUgAAAA4AAAANCAIAAAAWvsgoAAAAAXNSR0IArs4c6QAAAAlwSFlzAAAO 

yAAADsMBrahYpwAAAItJREFUKFNj/P//PwNxgIk4ZWBVQFOBoBsMsGqrqqr6CgYsaNIPHz6EiMjJ 

yb19+xbISE9PLy4uBjLQlSLrFBYWBnITExN9fHyADMJulZCQgOgnrFRUVJRYpXAnETb19evXxJr6 

4sULiFJ8IfDt2zegii1btmRkZGBRKi8vjxbSwKjJysoCCjISnwYATtwwhahioZoAAAAASUVORK5C 

YII= 

--001636c5977303b92404af962ba6-- 

Питон код я использую:

import email 
from BeautifulSoup import BeautifulSoup 

message = email.message_from_file(open(r'C:\shpiz\test\msg\12248')) 
cid_list = [] 
images = [] 
for part in message.walk(): 
    if str(part.get_content_type()) == 'text/html': 
     soup = BeautifulSoup(part.get_payload(decode=True)) 
     cid = '<%s>'%soup('img')[0]['src'][4:] 
     cid_list.append(cid) 

for part in message.walk(): 
    if part.get('Content-ID') in cid_list : 
     images.append((part.get_filename(),part.get_payload(decode=True))) 
for name, image in images: 
    with open(r'c:\shpiz\test\%s'%name,'w') as f: 
     f.write(image) 

Изображение сохранено, к сожалению, не очень хорошо. (Никакая программа не открывает его).

Я посмотрел на оригинальные и новые файлы изображений с помощью блокнота ++, и есть разница. Похоже, что это разрыв строки моей сгенерированной копии, отсутствующей в оригинале. это не единственное отличие, хотя, поскольку удаление строки в блокноте ++ не делает изображение открытым. Разницу, которую я описал, можно увидеть here

Поблагодарили бы за помощь в обнаружении проблемы.

ответ

2

Вы пишете изображение в текстовом режиме, а Python управляет концами строк. Откройте его в режиме wb, чтобы написать его дословно.

+0

Спасибо. Это была проблема. –

0

Проблема заключается в этой линии:

for name, image in images: 
    with open(r'c:\shpiz\test\%s'%name,'w') as f: 
     f.write(image) 

Файл, который вы создаете с открытым текстовый файл по умолчанию. Вы должны использовать 'b' вместе с 'w'. Но я не знаю, решит ли это всю проблему. Вам может понадобиться специализированный считыватель/запись для графических файлов.

+0

Фактически сохранение с 'wb' вместо 'w +' было единственной проблемой. так глупо, что я потратил много времени, чтобы найти это –

Смежные вопросы