2013-12-03 4 views
0

Я новичок, когда дело доходит до программирования и питона. Поэтому у меня есть вопрос. С моими сокурсниками мы создали несколько скриптов python, но теперь мы застреваем и больше не имеем идей. Нам нужно объединить несколько скриптов python в один рабочий сценарий. Может ли кто-нибудь помочь нам в этом, пожалуйста? Сценарии:Как слить несколько скриптов python в один?

# Script: webpage_get.py 
# Desc: Fetches data from a webpage, and parses out hyperlinks. 
# Author: Wojciech Kociszewski 
# Created: Nov, 2013 
# 
import sys, urllib 

def wget(url): 
    ''' Try to retrieve a webpage via its url, and return its contents''' 
    print '[*] wget()' 
    #open file like url object from web, based on url 
    url_file = urllib.urlopen(url) 
    # get webpage contents 
    page = url_file.read() 
    return page 

def main(): 
    #temp testing url argument 
    sys.argv.append('http://www.soc.napier.ac.uk/~cs342/CSN08115/cw_webpage/index.html') 
    #check args 
    if len(sys.argv) != 2: 
     print '[-] Usage: webpage_get URL' 
     return 

    #Get and analyse web page 
    print wget(sys.argv[1]) 

if __name__ == '__main__': 
    main() 
# Script: webpage_getlinks.py 
# Desc: Basic web site info gathering and analysis script. From a URL gets 
# page content, parsing links out. 
# Author: Wojciech Kociszewski 
# Created: Nov, 2013 
# 
import sys, re 
import webpage_get 

def print_links(page): 
    ''' find all hyperlinks on a webpage passed in as input and print ''' 
    print '[*] print_links()' 
    # regex to match on hyperlinks, returning 3 grps, links[1] being the link itself 
    links = re.findall(r'(\<a.*href\=.*)(http\:.+)(?:[^\'" >]+)', page) 
    # sort and print the links 
    links.sort() 
    print '[+]', str(len(links)), 'HyperLinks Found:' 
    for link in links: 
     print link[1] 

def main(): 
    # temp testing url argument 
    sys.argv.append('http://www.soc.napier.ac.uk/~cs342/CSN08115/cw_webpage/index.html') 
    # Check args 
    if len(sys.argv) != 2: 
     print '[-] Usage: webpage_getlinks URL' 
     return 

    # Get the web page 
    page = webpage_get.wget(sys.argv[1]) 
    # Get the links 
    print_links(page) 
if __name__ == '__main__': 
    main() 
# Script: webpage_getemails.py 
# Desc: Basic web site info gathering and analysis script. From a URL gets 
# page content, parsing emails out. 
# Author: Wojciech Kociszewski 
# Created: Nov, 2013 
# 
import sys, re 
import webpage_get 

def print_emails(page): 
    ''' find all emails on a webpage passed in as input and print ''' 
    print '[*] print_emails()' 
    # regex to match on emails 
    emails = re.findall(r'([\d\w\.-_][email protected][\w\d\.-_]+\.\w+)', page) 
    # sort and print the emails 
    emails.sort() 
    print '[+]', str(len(emails)), 'Emails Found:' 
    for email in emails: 
     print email 

def main(): 
    # temp testing url argument 
    sys.argv.append('http://www.soc.napier.ac.uk/~cs342/CSN08115/cw_webpage/index.html') 
    # Check args 
    if len(sys.argv) != 2: 
     print '[-] Usage: webpage_getemails' 
     return 

    # Get the web page 
    page = webpage_get.wget(sys.argv[1]) 
    # Get the emails 
    print_emails(page) 

if __name__ == '__main__': 
    main() 
+0

Опубликуйте их здесь и, возможно, мы сможем предоставить предложения конкретные вопросы. В противном случае, вероятно, нет. Вы можете попробовать codereview.stackexchange.com после того, как вы их объедините. – Joe

ответ

0

Проанализируйте ваши сценарии и найти общий код

Преобразовать общий код в модуль

Перепишите индивидуальные программы с общим кодом

Если затем вы хотите сделать отдельные программы в одну большую программу, будет намного проще

Смежные вопросы