DOCDB – Was nicht passt, wird passend gemacht DOCDB – Was nicht passt, wird passend gemacht
Teil I: Exotische Dokumentenartencodes und Nummernsuffixe – Überblick
Die Ermittlung des Stands der Technik auf einem technischen Gebiet erfordert einen schnellen und einfachen Zugriff auf möglichst viele Patentinformationsdaten, sobald diese verfügbar werden. Der EPA-Dienst DOCDB ist eine der größten bibliografischen Datenbanken der Welt. Sie enthält Informationen über Anmeldungen und erteilte Patente, Gebrauchsmuster und gewerbliche Muster sowie über andere Arten gewerblicher Schutzrechte. Die fast 140 Millionen Dokumente aus über 90 Ländern weltweit reichen bis in die frühen 1800er Jahre zurück, und täglich wächst der Datenbestand weiter.
Die größte Herausforderung für die EPA-Datenfachleute besteht in der großen Breite der Dokumentenarten und Datenformate, d. h. alte EPA-Dokumente ebenso wie von IP-Ämtern übermittelte Dokumente, insbesondere, wenn sie unvollständig sind oder die DOCDB-Anforderungen nicht erfüllen. Dabei sind viele Faktoren zu berücksichtigen: das Alter des Dokuments, welche Dokumente die Ämter bereitstellen können und dürfen, ämterspezifische Codes und Formate, unterschiedliche IP-Systeme sowie die häufigen Überarbeitungen der nationalen Patentgesetze.
Um so viele Daten wie möglich zu erfassen und Lücken in den bibliografischen Daten zu schließen, mussten unsere Fachleute passend machen, was nicht passte. Inspiriert von den INID-Codes , hatten sie die Idee, das zugrunde liegende Prinzip auf sogenannte Nichtveröffentlichungen (wie Anmeldungs- und Prioritätsdatensätze) anzuwenden. Da diese Dokumente nicht mit Dokumentenartencodes erstellt wurden, waren sie in den bibliografischen Daten nicht öffentlich verfügbar. Dank der Zuweisung interner Dummy-Codes und Suffixe konnten die Dokumente sofort hochgeladen werden, was dazu beitrug, Datenlücken provisorisch und in manchen Fällen auch dauerhaft zu schließen.
Diese Lösung eignet sich gut für die meisten Datensätze, aber es gibt auch einige, bei denen ein manuelles Eingreifen erforderlich ist. Unsere Expertinnen und Experten müssen dann die Daten sorgfältig prüfen, um zu entscheiden, was verwendet werden kann oder verworfen werden muss oder ob die Daten erneut bereitgestellt werden müssen.
Solche "exotischen" internen Dummy-Codes und Suffixe sind zwar selten, aber Sie können bei Ihrer täglichen Arbeit gelegentlich noch auf sie stoßen (und sie fälschlicherweise für Datenfehler halten). Die nachstehende Übersicht hilft Ihnen, solche Codes zu erkennen. Außerdem können Sie in der Liste " Übersicht über die Dokumentenartencodes " nachsehen.
Detaillierte Beschreibungen dieser Dokumentenartencodes finden Sie in Teil II dieses Artikels in einer der nächsten Ausgaben von Patent Knowledge News.
Interne Dummy-Dokumentenartencodes (Übersicht)
- D und Q kennzeichnen unvollständige Anmeldungen sowie Anmeldungen in einem unzulässigen Format.
- K, L, M, N und O werden für Anmeldungen bestimmter Rechtssysteme verwendet.
- E, F und M stehen für französische Anwendungen zwischen 1900 und den 1960er-Jahren.
Abbildung 1: Beispiel für die Anwendung des Dokumentenartencodes "D" auf eine Anmeldenummer
Suffixe für Prioritäts- und Anmeldenummern (Übersicht)
- D (vorläufige Anmeldung) und T (Priorität) werden provisorisch bis zum Erhalt des vollständigen Datensatzes angewendet.
- T wird verwendet, um Dummy-Prioritäten für sehr frühe Veröffentlichungen zu erstellen und sie in technischen Familien zusammenzufassen.
- X kennzeichnet in Veröffentlichungen aus dem frühen 20. Jh. beanspruchte Prioritäten.
Abbildung 2: Beispiel für die Anwendung des Suffixes "T" auf eine Prioritätsnummer
Im zweiten und letzten Teil dieses Artikels werden wir einen genaueren Blick auf diese exotischen Codes und Nummernsuffixe werfen und unter anderem Entstehung und Umsetzung näher beleuchten.
Abonnieren Sie den EPA-Newsletter , um diesen und andere Artikel nicht zu verpassen.
Schlagwörter: DOCDB, Dokumentenartencodes, Nummernsuffixe