kleiner Fehler im Names Parser

mam

Ich hab heute mal Ember mutig auf das komplette Filmarchiv hier losgelassen und musste dabei feststellen, dass bestimmte Namesformate nicht korrekt erkannt werden.

Meine Filme liegen (wie nach Empfehlung) in separaten Verzeichnissen deren Name sich aus "<titel>(<Jahr>)" zusammensetzt.

Das klappt grundsätzlich gut, funktioniert aber nicht bei Titeln wie z.B.

"20000 Meilen unter dem Meer (1954)"

oder

"2001 eine Odysee im Weltraum (1968)"

Ember interpretiert die erste gefundene Zahl als Herstellungsjahr und sucht deshalb nach "Meilen unter dem Meer (20000)" bzw. "Odysee im Weltraum (2001)".
Und natürlich scheitert es damit kläglich.

Klar, man kann dann von Hand die Felder korrigieren und neu suchen lassen, aber grundsätzlich sollte irgendwann der Parser überarbeitet werden und den angehängten geklammerten Zahlen Preferenz geben. Vielleicht muss ja nur irgendwo die Reihenfolge der Parserregeln geändert werden ?

pacoma

sollte auch heissen

2001 - Odyssee im Weltraum (1968)

20.000 Meilen unter dem Meer (1954)

dann klappt das auch

mam

na ja, unbefriedigend, aber für 2 Filme wollen wir mal keinen Stress machen.

Habt ja nur Glück gehabt, dass "1984" auch 1984 rausgekommen ist, sonst wären es schon drei Kandidaten

Allerdings darfst Du mir bitte noch verraten, wie ich "2012 (2009)" (Roland Emerich) schreiben soll, damit er daraus nicht "Eiszeit New York 2012 (2011)" (Trey Stokes / Travis Fort) macht.
Mir fällt keine virtuose Schreibweise zu "2012" ein...

root2

Was spricht gegen 2012 (2009)?

Der Eiszeit Film müsste - wie Du schon sagst - so heißen:
Eiszeit - New York 2012 (2011)

Sind beides unterschiedliche Filme und auch eindeutig als solche zu erkennen.

Von "1984" sind mehr als nur ein paar Versionen existent. Diese sollten aber auch alle sauber durch entsprechene Jahreszahlen trennbar sein, da keines der Werke im gleichen Jahr herausgekommen ist (1954, 1956, 1984, 2008).

mam

Na, der Grund meines Postings liegt doch darin, dass Ember meint, statt "2012 (2009)" stände da "2012 (2012)".

Und bei der Suche findet er dann immer den Eiszeit - New York Film.

Sobald irgendeine halbwegs gültige Jahreszahl (aus 20000 liest er 2000 / Zahlen ausserhalb des normalen Bereiches, z.B "3096 Tage" ignoriert er korrekt) VORNE steht, wird die Jahreszahl HINTEN in Klammern nicht mehr ausgewertet.

Probiers mit 1984 aus meinetwegen (ich hab nur die eine Version hier), er wird wahrscheinlich IMMER "1984 (1984)" suchen und finden, egal, was Du da hast.

Es geht ja noch, wenn er, wie in meinen ersten Beispielen "20000 Meilen..:" und "2001 Odysee im Weltraum" dann GAR nichts findet, das erkennt man ja noch in der Liste, da kein NFO erstellt wird.
Spätestens bei 2012 wirds dann aber häßlich, da er da den falschen Film findet und stillschweigend einträgt. Den hab ich aus der Gesamtmenge eigentlich nur durch Zufall gefunden, da meine Sammlung eigenlich kein B-Filme enthält und ich stutzig wurde.

root2

Wenn es EMM spezifische Dinge sind bin ich leider raus.
Ich scrape mit ME jeden Film "per Hand" (verlasse mich also nicht auf die Suche je nach Filmtitel), da habe ich die Kontrolle, welchen Datensatz er zieht.

Würde mich aber wundern, wenn EMM das nicht auch beherrschen würde...

mam

Tscha, hatte mich auch gewundert, deshalb melde ich mich ja hier.

Was ist denn ME? jemand hier hatte mir EMM empfohlen um Filme einzuordnen (manuell), die nicht in den Datenbanken enthalten sind, Ging auch ganz gut, dann kam ich auf die Idee, dochmal ALLE Filme durchzujagen und bin dann auf dieses Problem gestossen.

pacoma

Mit ME ist MediaElch gemeint

Gesendet von meinem iPad mit Tapatalk

DanCooper

Ich werde zusehen, dass die Erkennung des Jahres ein wenig besser funktioniert. Ausschliessen kann man solche Fehler leider nie ganz.

root2

Jupp, ganz ohne Problemfälle wirds bestimmt nicht laufen, wenn man alles vollautomatisch scraped.
Leider kenne ich Dein EMM zu wenig

Bei ME gehe ich immer so vor, dass ich halt nicht alles automatisch machen lasse, sondern bei jedem Film sage: Zeige mir an, welche Filme Du dem Namen zuordnen würdest und ich entscheide dann anhand der Ergebnisliste, welcher der (vermeintlich) Richtige ist.

DanCooper

Zitat von root2

Jupp, ganz ohne Problemfälle wirds bestimmt nicht laufen, wenn man alles vollautomatisch scraped.
Leider kenne ich Dein EMM zu wenig
Bei ME gehe ich immer so vor, dass ich halt nicht alles automatisch machen lasse, sondern bei jedem Film sage: Zeige mir an, welche Filme Du dem Namen zuordnen würdest und ich entscheide dann anhand der Ergebnisliste, welcher der (vermeintlich) Richtige ist.

Ja, das geht bei Ember natürlich auch und ist auch bei mir das bevorzugte Vorgehen.

Es gibt in Ember auch die Möglichkeit, die Filme automatisch im "Skip" Modus zu scrapen. Im "Skip" Modus wird nur dann ein Film gescrapt, wenn es genau ein Suchergebnis gibt. Das sollte beim Film 2012 mit falschem Jahr "2012" dann kein Ergebnis liefern und der Film auch nicht gescrapt werden.

root2

Zitat von DanCooper

...
Ja, das geht bei Ember natürlich auch und ist auch bei mir das bevorzugte Vorgehen.
Es gibt in Ember auch die Möglichkeit, die Filme automatisch im "Skip" Modus zu scrapen. Im "Skip" Modus wird nur dann ein Film gescrapt, wenn es genau ein Suchergebnis gibt. Das sollte beim Film 2012 mit falschem Jahr "2012" dann kein Ergebnis liefern und der Film auch nicht gescrapt werden.

Klingt nach einer guten Lösung, die auch den TO zufriedenstellen sollte

mam

Na ja, der Fehler tritt genauso im Skip Modus auf, das bringt einen also nicht weiter.

Es gibt genau eine (falsche) Antwort auf 2012 (2012), nämlich diesen besagten B-Movie.

Ihr müsst selber wissen, ob ihr ihn irgendwann beseitigen wollt, oder nicht, ich hab nur brav gemeldet, dass er vorhanden ist

das erwähnte "EM" habe ich auch mal heute morgen ausprobiert, das parsed die Dateinamen korrekt und produziert richtige Suchanfragen (allerdings war es bei 39 Filmen der Meinung, sie wären in einem anderen Jahr entstanden und baten um manuelle Korrektur. Offensichtlich weisen die verschiedenen Datenbanken nicht überall dieselben Daten auf, das ist also weniger ein Problem des Tools).

DanCooper

Ja, da hast du natürlich recht, bringt in dem Fall nicht viel mit Skip Modus zu arbeiten.

Ich habs nun soweit gefixt, dass die Regex von rechts nach links sucht. Im Beispiel 2012 (2009) wird nun 2009 als Jahr verwendet. Ich denke so sollten die meisten Problemfälle beseitigt sein.

mam

jo, so sollte es deutlich besser gehen, danke!

ich dachte eigentlich, Du suchst "$####$$" (1900 < #### < 2100), so wie ich das verstehe, wurden die Klammern extra als Jahrestrenner dafür vorgesehen.

Aber ist egal, so kommt bei beiden dasselbe raus, das sollte das Problem beseitigen.

DanCooper

Zitat von mam

jo, so sollte es deutlich besser gehen, danke!
ich dachte eigentlich, Du suchst "$####$$" (1900 < #### < 2100), so wie ich das verstehe, wurden die Klammern extra als Jahrestrenner dafür vorgesehen.
Aber ist egal, so kommt bei beiden dasselbe raus, das sollte das Problem beseitigen.

Früher ging es nur mit Klammern, doch war unnütz für die, die den Dateinamen vorher nicht manuell ändern. Meistens siehts ja nach dem Download irgendwie so aus: avatar.bdrip.2014.x264.mkv.

Nepomuk

So wie dir @root2 auch schon geschrieben hat, überlasse ich es auch nicht dem Zufall, dass der Scraper den richtigen Film findet.

Aus diesem Grund schreibe ich die IMDB-ID in den Verzeichnis/Dateinamen mit rein. Ember findet die ID und scrapt dann nur nach diesem Film - Verwechslung ausgeschlossen.
Bei 2012 sieht es bei mir so aus:
2012 (2009) tt1190080

Du siehst viele Wege führen nach Rom.

root2

Zitat von Nepomuk

...Du siehst viele Wege führen nach Rom.

Jeder hat seinen Lieblingsweg

Ich scrape mit ME nur Originaltitel, Jahr und IMDB-ID in eine NFO.
Ein kleines selbst geschriebenes Tool parsed alle NFOs in einem Verzeichnis, schaut dann, ob jeweils ein passender Film dazu existiert, baut aus den NFO Daten einen Unterordner mit Jahreszahl, verschiebt den Film in den Unterordner und baut eine neue NFO, die nur die IMDB-URL enhält.
Das lese ich dann direkt mit Kodi ein und fertig ists.

Klar können viele Tools das auch schon automatisch. Aber ich wollte eine eigene Lösung

mam

Ja, viele Wege führen nach Rom, aber eure Vorschläge führen eher zur dunklen Seite der Macht.

So ein Tool ist nur dann hilfreich, wenn es mit geringst möglichen Input den maximalen Output bringen kann. Dazu gehört sicherlich nicht die Angabe von mystischen IDs.

Woher soll der Anwender die denn kennen?

Ja, richtig, kann er im Internet raussuchen, damit macht er aber nichts anderes, als das Programm, das er benutzen will, ebenfalls. Er scraped!
Dann brauch ich auch keinen Ember Manager mehr, das bißchen Tippen und umbenennen schaff ich dann auch noch.
(ist zwar etwas überspitzt formuliert, aber ich glaub, ihr versteht, worauf ich hinaus will).

Oder man kann es auch zusammenfassen zu "ich muß ein Suchprogramm benutzen um ein Suchprogramm benutzen zu können". Klingt reichlich krank :-)))

Ein Anwender hat üblicherweise nur den Titel und ein (ungefähres) Jahr als Infos zur Verfügung, sowas wird z.b. bei Aufnahmen vom TV mitgeliefert im EPG. Hinzu kommen noch Hauptdarsteller und ggf Regisseur, die kann man sich noch merken. Dann wirds aber langsam einsam und die Kramerei geht los...

Selbst Titel und Jahr sollte das Suchprogramm nicht allzu wörtlich nehmen, ich bin da ein Fan von toleranter Suche nach Art der Fuzzy-Logik.

root2

Naja, die Sache ist so: Es ist kein leichtes (triviales) Problem, Filme zu matchen und zu taggen, sodass sie in Kodi integriert werden können

Irgendwo muss die Intelligenz "alles richtig zu machen" also herkommen:
- Vom User durch entsprechende viel Wissen bezüglich der Thematik und Interaktion mit Tools
- Von den Tools selbst bzw. demjenigen, der die Tools "baut"

Letzteres setzt aber voraus, dass alle eventuell auftretenden Unannehmlichkeiten, Kombinationen und Unwägbarkeiten beim Entwickeln mit bedacht werden - was einfach nie möglich sein wird (Du kennst ja vielleicht den Satz von Einstein mit dem Universum und den Menschen ). Natürlich wird man über entsprechend trickreiche Programmierung einiges abfangen können. Aber wenn Du mal 1000 oder mehr Filme in einem Rutsch automatisch durchlaufen lässt, besteht halt einfach immer die Chance, dass es zu Problemen kommt.

Daher muss einfach eine gewissen Intelligenz auch beim Benutzer vorhanden sein.

Ich möchte damit niemandem zu nahe treten und sagen, dass er zu wenig intelligent ist! Aber man muss ich einfach im Klaren sein, dass der Job "einfach mal die Filme in die Bibliothek zu bekommen" alles andere als trivial ist!

Und das bedeutet, dass man sich als User ab und an vielleicht auch mal etwas mehr in die Materie einarbeiten muss

P.S.: Was Du meinst ist im Übrigen keine Fuzzylogik, sondern Fuzzy-Search (unscharfe Suche)

Jetzt mitmachen!