Hilfe bei einfachem scraping Addon (auf Basis chefkoch-plugin)

  • Sers Leute!

    _Jin hat mir im kodinerds IRC schon den ganzen Nachmittag echt geholfen mich langsam in die Materie python reinzubringen, aber leider steh ich immer noch mit einem Problem am Schlauch.

    Wir haben das Plugin chefkoch ( https://github.com/kodinerds/repo…ch_de-2.0.7.zip ) als Vorlage genommen und so umgebaut, dass es von der Seite "http://www.multimedia.ethz.ch/speakers/d_arch" eine Liste mit den Child-Pages "class = "sub-lev3" " ausgibt und in der Unterliste def Listvideos kommt es nun zu einem kleinen Problem.

    Anscheinend macht dieser Teil Probleme, ich kriege nämlich von Kodie die ganze Zeit "list exceeds" im [definition='1','0']log[/definition] ausgespuckt. Da ich in der Materie Neuling bin komm ich leider nicht drauf was der Fehler genau ist, aber ich glaube der Hund liegt hier begraben:


    Code
    content = getUrl(url)
       tbody = re.search('<tbody>(.*?)</tbody>', content, re.DOTALL).group(1)
       spl = tbody.split('<tr>')

    danach kommt:

    Code
    for i in range(1, len(spl), 1):
            entry = spl[i]
            match = re.compile('<li class=\'video\'><a href=\'(.+?)\'', re.DOTALL).findall(entry)
            url = match[0]
            match = re.compile('<span>(.+?)<', re.DOTALL).findall(entry)
            title = cleanTitle(match[0])
            addLink(title, url, 'playVideo', '', '')


    Der ganze default.py-Code.

    ----------------------
    Und wenn ich das hinkriege als erste Übung, kann mich jemand vielleicht in die richtige Richtung leiten wie ich von hier die Videos bekommen könnte? :P

    https://tube.tugraz.at/engage/ui/brow…=courses&page=2

    Mit Quelltext geht da nämlich gar nix...

    lg

    Einmal editiert, zuletzt von vozer (20. Dezember 2016 um 23:00)

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!