[Wikide-l] Fwd: Umwandlung von 290.000 Wikipedia-Personendaten in PND-like-Datens�tze

Mathias Schindler mathias.schindler at gmail.com
Fr Nov 20 08:32:52 UTC 2009


Hi,

nachfolgende Email ging vorhin an die Bibliothekarsmailingliste
inetbib, ich schicke Sie euch hier als Forward.

Viel Spa� damit :)

Mathias


---------- Forwarded message ----------
From: Mathias Schindler <mathias.schindler at gmail.com>
Date: 2009/11/20
Subject: Umwandlung von 290.000 Wikipedia-Personendaten in PND-like-Datens�tze
To: Internet in Bibliotheken <inetbib at ub.uni-dortmund.de>


Liebe Liste,

wie vielleicht einigen schon bekannt, verkn�pfen die Autoren der
Wikipedia seit 2005 Personeneintr�ge der deutschsprachigen Wikipedia
mit dem dazugeh�rigen PND-Datensatz, sofern verf�gbar. Ein Nutzen
dieser Aktion ist beispielsweise das Bequeme Hinf�hren von Lesern zum
Katalog der DNB (prinzipiell zu jedem Katalog, der etwas mit
PND-Nummern anfangen kann). Von (alle zahlen sachte gerundet) 900.000
Artikeln der Wikipedia sind 300.000 �ber Personen, davon sind 100.000
davon mit PND-Nummern versehen. Zu den �brigen 200.000 Personen sind
entweder noch keine Datens�tze in der PND vorhanden oder wir haben sie
noch nicht entdeckt und verkn�pft (mehr Infos finden Sie unter
http://hsozkult.geschichte.hu-berlin.de/tagungsberichte/id=2806 und in
den dort verlinkten Vortragsfolien).

Ich m�chte Ihnen daher eine kleine Technologiedemonstration zeigen,
die Christian Thiele entwickelt hat; wir nennen sie derzeit "Projekt
zur Entwicklung einer Elektronischen Normdatei f�r deutschsprachige
Enzyklop�disten" (PeEnDe). Titel und Abk�rzung kann man schnell wieder
vergessen, der Inhalt z�hlt.

Dabei werden aus den in Wikipedia gespeicherten Informationen
Datens�tze im PND-Format angelegt, z.B.:
http://toolserver.org/~apper/pd/PeEnDe.php?id=2155

Die ID in diesem Tool entspricht der internen Artikel-ID der Wikipedia
(und steht im HTML-Quelltext). Da sie nur halbwegs stabil ist, eignet
sie sich keinesfalls f�r eine dauerhafte externe Referenzierung.

Einen kompletten Abzug aller Daten finden Sie auf 23 MByte komprimiert
http://toolserver.org/~apper/pd/PeEnDe.zip

Ich freue mich sehr �ber Feedback, Fehlerberichte oder Anregungen, wie
zul�ssige Felder der PND noch automatisch aus Wikipedia besetzt werden
k�nnen. Unter anderem sollten wir noch in der Lage sein, aus den
Kategorien eines Artikels einen oder mehrere Berufe f�r Feld 315
verwenden zu k�nnen.

Zur Sicherheit eine Wiederholung: Dies ist kein eigenst�ndiges
Normdatenprojekt, wir empfehlen weiterhin allen Interessierten die
Nutzung der echten PND.

Wenn Sie eine weitere thematisch passende Mailingliste f�r diese
Ank�ndigung kennen, leiten Sie diese bitte weiter.

Viele Gr��e,
Mathias Schindler