„Wikipedia:Bots/Anfragen/Alt1“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Inhalt gelöscht Inhalt hinzugefügt
→‎Ansatz (Damit es hier endlich mal vorrangeht ;o) ): Vorschlag 3: mehrzeilig ist doch irgendwie besser!
Zeile 136: Zeile 136:
Wie sieht es aus mit der regex-liste, die oben angesprochen wurde?
Wie sieht es aus mit der regex-liste, die oben angesprochen wurde?
Ich habe jetzt ganz einfach mal den Ansatz für die Liste gewagt (hat bisher nur den erwähnten eintrag) :
Ich habe jetzt ganz einfach mal den Ansatz für die Liste gewagt (hat bisher nur den erwähnten eintrag) :
http://de.wikipedia.org/wiki/Benutzer:Deadbot/regex
Benutzer:Deadbot/regex
Gedacht ist, dass das ganze zeilenweise notiert wird:
Gedacht ist, dass das ganze zeilenweise notiert wird:
<pre>
<pre>
Zeile 178: Zeile 178:
:::Bei einer zweizeiligen Notation würde ich eine Notation begrüßen, die zusammengehörige Paare kennzeichnen kann, so dass nicht durch das Vergessen von einer R- oder C-Angabe dass System durcheinander gebracht wird. Gruß, --[[Benutzer:Rhododendronbusch|Rhodo]] <sup>[[Benutzer Diskussion:Rhododendronbusch|Busch]]</sup> 23:37, 26. Mai 2008 (CEST)
:::Bei einer zweizeiligen Notation würde ich eine Notation begrüßen, die zusammengehörige Paare kennzeichnen kann, so dass nicht durch das Vergessen von einer R- oder C-Angabe dass System durcheinander gebracht wird. Gruß, --[[Benutzer:Rhododendronbusch|Rhodo]] <sup>[[Benutzer Diskussion:Rhododendronbusch|Busch]]</sup> 23:37, 26. Mai 2008 (CEST)
::::Ich bin leider kein allzu großer regex-Kenner. Man müsste sich ja nur mal nach einem Zeichen kundig machen, das in den regexes nie vorkommen kann, und das dann als Trennzeichen verwenden. Damit hätten wir unsere einzeilige Notation --[[Benutzer:Stummvoll|Stummi]]([[Benutzer_Diskussion:Stummvoll|D]]|[[Benutzer:Stummvoll/Bewertung|B]]) 14:20, 27. Mai 2008 (CEST)
::::Ich bin leider kein allzu großer regex-Kenner. Man müsste sich ja nur mal nach einem Zeichen kundig machen, das in den regexes nie vorkommen kann, und das dann als Trennzeichen verwenden. Damit hätten wir unsere einzeilige Notation --[[Benutzer:Stummvoll|Stummi]]([[Benutzer_Diskussion:Stummvoll|D]]|[[Benutzer:Stummvoll/Bewertung|B]]) 14:20, 27. Mai 2008 (CEST)

:::::Ich bin noch mal in mich gegangen und dabei ist mir noch was eingefallen: Eine mehrzeilige Syntax ist sinnvoller: Man kann dann später noch Optionen hinzufügen, z.B. den Beschreibungstext, den der Bot in die Zusammenfassungszeile klatscht, wenn er eine Aktion durchführt. Ausserdem verliert man so nicht den Überblick wenn man die Seite bearbeitet.
:::::Ich habe auch mal einen Absatz in deine Seite eingefügt, wo schon mal Regexe samt Korrekturen gesammelt werden können.
:::::Gruß, --[[Benutzer:Rhododendronbusch|Rhodo]] <sup>[[Benutzer Diskussion:Rhododendronbusch|Busch]]</sup> 21:14, 27. Mai 2008 (CEST)


== Gesichtete und geprüfte Versionen - Datenfehler in Spezialseiten ==
== Gesichtete und geprüfte Versionen - Datenfehler in Spezialseiten ==

Version vom 27. Mai 2008, 21:14 Uhr

Hilfsmittel

Wikipedia:Bots/Anfragen-Kopf

Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 2 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. Die Archivübersicht befindet sich unter Wikipedia:Bots/Anfragen/Archiv.

Fehler bei Vorlage * Parametername unbekannt (Vorlage:Autoarchiv-Erledigt): "Modus"

Vorlage:Autoarchiv-Erledigt/Wartung/Festes_Ziel

Ergebnisse der Kommunalwahlen in Bayern

Am 1. Mai treten die neu gewählten Bürgermeister und Gemeinderäte in Bayern ihre Mandat an. D.h. zu diesem Zeitpunkt müssten zahlreiche Angaben zu den Bürgermeistern in der Infobox Gemeinde in Deutschland aktualisiert werden. Zu den Gemeinderäten wird hier die Einführung einer Infobox Gemeindevertetungen diskutiert, deshalb möchte ich mal vorab Fragen, ob es möglich wäre beides per Bot zu aktualisieren. Grüße --Septembermorgen 13:26, 17. Mär. 2008 (CET)[Beantworten]

Sind das Ersetzungen in der Infobox oder auch im Fließtext? Was muss denn genau gemacht werden? Kannst du ein Beispiel-Diff angeben? Wie sehen die Rohdaten aus? Haben sie immer das gleiche Format? --Euku B ¿ 14:56, 24. Mär. 2008 (CET)[Beantworten]
Die Namen der Bürgermeister müssten in der Infobox ersetzt werden, man könnte die Rohdaten dafür so aufbereiten, wie man es bei den Einwohnerzahlen gemacht hat, der einzige prinzipielle Unterschied ist der, dass man das Geschlecht mit berücksichtigen muss. Was die Zusammensetzung der Gemeinderäte betrifft, hängt das Rohformat der Daten halt davon ab, welche (oder ob) der hier diskutierten Vorlagen überhaupt per Bot aktualisiert/erstellt werden können. --Septembermorgen 18:28, 29. Mär. 2008 (CET)[Beantworten]
Die Bürgermeister klingen machbar. Wenn es die IB Gemeindevertetungen schon gäbe wäre das kein Problem, aber ich müsste (wenn ich dich recht verstehe) dann im Fließtext nach einer dieser Tabellen suchen und ersetzen. Das geht schon generell, wenn es nur diese aufgeführten Typen gibt, aber da sehe ich das meiste Problempotenzial. --Euku B ¿ 09:51, 14. Apr. 2008 (CEST)[Beantworten]
Hier befindet sich eine Liste der neu ins Amt gewählten Bürgermeister Benutzer:Septembermorgen/Bürgermeister in Bayern neu Mai 2008, könnte die per Bot eingelesen werden? Die Infobox Gemeindevertretung bleibt zunächst mal außen vor. Grüße --12:22, 17. Mai 2008 (CEST)
Die Liste ist gut, das soll also so aussehen? Was tue ich bei Frauen? Wann soll ich mit dem Lauf beginnen? Nächste Woche komme ich wohl eher nicht dazu. --Euku:B 12:54, 17. Mai 2008 (CEST)[Beantworten]
Ja so müsste das aussehen. Wenn das möglich ist sollte bei Frauen immer die Zeile Bürgermeistertitel = Bürgermeisterin eingefügt werden. Bzw. bei Männern sollte das dann ggfs. entfernt werden. Die Fallunterscheidung Bürgermeistertitel = Oberbürgermeister/in kann unter Umständen auch auftreten, das „-in“ müsste da ggfs entfernt bzw. hinzugefügt werden. Sollte da von Hand nachgearbeitet werden müssen, kann ich das machen. Wenn die Liste so i.O. ist kann der Lauf beginnen, sobald Du dazu Zeit hast. --Septembermorgen 20:10, 17. Mai 2008 (CEST)[Beantworten]

Aktualisierung der Einwohnerzahlen+Haushalte philippinischer Städte und Gemeinden

Hallo zusammen, könnte man die Zensusdaten vom 1.8.2007 [1] in den Infoboxen der philippinischen Städte und Stadtgemeinden per Bot einpflegen. Und was müsste ich in der Zuordnungstabelle mit berücksichtigen? Dank im Voraus --Septembermorgen 12:07, 21. Apr. 2008 (CEST)[Beantworten]

Ich würde empfehlen, da analog zur Vorlage:Einwohnerzahlen Islands vorzugehen, also eine zentrale "Sammelstelle" für die Zensusdaten anzulegen und diese dann in den entsprechenden Artikeln in der Infobox zu referenzieren. Letzteres ist (je nach Infobox und Vorlage-Format) dann sogar ohne Bot möglich - die Infobox kann die Vorlage entsprechend ansteuern (sofern die Seitennamen stimmen). --Guandalug 10:41, 23. Apr. 2008 (CEST)[Beantworten]
Hallo Guandalug, dieses Vorgehen ist eine wesentliche Arbeitserleichterung, und v.a. bei regelmäßig veränderlichen Daten sehr sinnvoll, ich werde deshalb für die anderen regelmäßig veränderlichen Daten der Infobox Ort auf den Philippinen (Einkommensklassifizierung, Bürgermeister, Haushalte) auch solche Vorlagen erstellen. Die zentrale Sammelstelle für die Einwohnerzahlen ist hier: Vorlage:Einwohnerzahlen der Philippinen, diese Vorlage müsste jedoch von jemand der das kann in die Infobox Ort auf den Philippinen eingebaut werden. Die Einwohnerzahlen (bzw. die über solche Vorlagen eingebundenen Daten) müssten dann korrekt angezeigt werden, auch wenn die alten Zahlen im Artikelquelltext bleiben. Imho sollten die alten Daten dennoch aus den Artikelquelltexten entfernt werden und durch einen entsprechenden Hinweis auf die zentralen Datenvorlagen ersetzt werden, wofür ein Boteinsatz hilfreich wäre, alleine der Transparenz wegen, auch wenn dies technisch nicht unbedingt erforderlich wäre. Gibt es gegen diese zentrale Datensammelstellen noch größere (z.B. urheberrechtliche) Bedenken? --Septembermorgen 12:37, 11. Mai 2008 (CEST)[Beantworten]
Das Entfernen der Daten aus den Artikel-Quelltexten ist so eine Sache - Bots sind leider nur begrenzt intelligent, und die Nebeneffekte sind unschön. Einfacher wäre es vermutlich, wenn ein Benutzer des AutoWikiBrowser sich da dran setzt und das halbautomatisch macht - der Vorteil läge in der visuellen Kontrolle der Änderungen durch den Benutzer. Oder meintest du die Altdaten in der Infobox? DAS wäre einfach, und sinnvoll (allerdings dann in einem Rutsch, wenn alle "zentral-Daten" erfasst sind) --Guandalug 09:28, 14. Mai 2008 (CEST)[Beantworten]
Zeigt einem der AWB die durch ihn mordifizierte Seite per Vorschau an? Oder nur den geänderten Seitenquelltext? Letzteres zeigt einem der PWB auch an. Gruß, --Rhodo Busch 19:40, 18. Mai 2008 (CEST)[Beantworten]

einer sog. 'beobachtungskandidaten-liste' zu einem späten sinn verhelfen ;) ...

...es geht um die liste Wikipedia:Beobachtungskandidaten/Lebtnoch. wurde grade est auf WP:FzW angesprochen. die bräuchte einfach nur einen regelmäßigen besuch, bei dem alle einträge die

  • ein todesdatum in den PD aufweisen, oder
  • durch LA/SLA entfernt wurden, oder
  • noch garnicht angelegt wurden (evtll. auch falsch geschrieben sind)

gelöscht werden.

erst dann macht diese liste IMHO sinn - manuell ist die pflege viel zu aufwendig: ich brauchte ne halbe stunde für 22 jahrgangssäuberungen...

müsste doch zu machen sein, oder? vielen dank im voraus und lieben gruß, --ulli purwin 01:26, 6. Mai 2008 (CEST)[Beantworten]

Die letzten beiden wären kein Problem, wie ich das Todesdatum aus den PD auslese wiß ich noch nicht, wird mir aber bestimmt noch einfallen. --/home/Wuzur /Diskussion/Bewertung 10:48, 6. Mai 2008 (CEST)[Beantworten]
\|STERBEDATUM=([^\r\n]+) Ich werd das dann mal durcharbeiten demnächst und regelmäßig danach --/home/Wuzur /Diskussion/Bewertung 11:50, 6. Mai 2008 (CEST)[Beantworten]
...klasse, lieber Wuzur! gruß, --ulli purwin 20:32, 6. Mai 2008 (CEST)[Beantworten]
Halte es etwas allgemeiner: \ *\|\ *STERBEDATUM\ *=\ *([^\r\n|]+) :-) --Euku:B 11:40, 14. Mai 2008 (CEST)[Beantworten]

Hallo, es gibt rund 150 Artikel, in denen ein Abschnitt "Weblinks:" vorkommt. Natürlich sollte das ganze ohne Doppelpunkt sein. Die Liste kann ich bereitstellen, da müsste dann nur ein Bot rübergehen, der "== Weblinks: ==" mit "== Weblinks ==" ersetzt (naja, bissl mehr schon: mit Leerzeichen und ohne etc. und am besten gleich sämtliche Überschriften checken). Sinnvoll für einen Bot? --APPER\☺☹ 21:06, 15. Mai 2008 (CEST)[Beantworten]

Könnte man das nicht allgemeiner fassen? Es gibt sicherlich auch viele Literatur-, Siehe-auch-, Quellen-Überschriften etc. mit überflüssigem Doppelpunkt. --Head 22:21, 15. Mai 2008 (CEST)[Beantworten]
Ja, das wär vermutlich das cleverste. Also eine Ersetzung der Art: ==[ ]?([^=]+):[ ]?== zu == $1 ==. Ich lass mal eine Liste der Artikel erstellen, auf die das zutrifft. --APPER\☺☹ 22:59, 15. Mai 2008 (CEST)[Beantworten]
Das sind tatsächlich 3500 Artikel. Will das jemand machen? Sollte ja relativ leicht sein, die Liste gibts bei mir. --APPER\☺☹ 23:25, 15. Mai 2008 (CEST)[Beantworten]
Wenn das bis Montag keiner machen will, kann ich mich mal drum kümmern, vorher komm ich nicht dazu. (Nicht, dass das dringend wäre). --Guandalug 09:09, 16. Mai 2008 (CEST)[Beantworten]
Ich reiße mich nicht drum, aber würde es machen. --Euku:B 13:35, 16. Mai 2008 (CEST)[Beantworten]
Die Liste der betroffenen Artikel gibts unter Benutzer:APPER/Überschriften. --APPER\☺☹ 15:14, 16. Mai 2008 (CEST)[Beantworten]

{{InuseBot|1=Euku:B 15:49, 16. Mai 2008 (CEST)}}[Beantworten]

Wo es gerade ums Thema geht: Was spricht dagegen, generell Doppelpunkte am Ende eines Überschrifttitels zu entfernen? Natürlich nicht vollautomatisch (auch wenn mir gerade kein Beispiel einfällt, wo es nützlich sein könnte), aber "== Siehe auch: ==" usw ist mir schon einige Male begegnet. Lässt sich auch problemlos mit AWB durchführen. --Aktionsheld Disk. 18:26, 16. Mai 2008 (CEST)[Beantworten]
Öh, genau das wird ja jetzt gemacht. Siehe diese Diskussion. Meine Liste enthält schon sämtliche Artikel, die Überschriften mit ":" am Ende enthalten. --APPER\☺☹ 18:32, 16. Mai 2008 (CEST)[Beantworten]
Argh, gestern abend nur den ersten Absatz gelesen und beschlossen, heute das drauf zu antworten... --Aktionsheld Disk. 19:24, 16. Mai 2008 (CEST)[Beantworten]
Da wird der Wiki-Syntax auch falsch genutzt. Die Überschrift sollte "Porteivorsitzende" heißen bzw. in dem Fall (wo es nur einen gab), einfach durch einen Satz ersetzt werden. Auch die horizontalen Linien sind dort mehr als fehlerhaft. Außerdem sollten nie Überschriftenebenen übersprungen werden, die erste genutzte Ebene sollte immer h2 sein (==). Zum Fett machen gibts z.B. die Möglichkeit, die Zeile mit ";" anzufangen. --APPER\☺☹ 18:50, 16. Mai 2008 (CEST)[Beantworten]
Das hier Wikisyntax mißbraucht wird, ist klar. Mir macht nur Angst, daß gleich das erste Beispiel, daß ich rausgriff, so ausfiel. Ich sehe hier für eine Botaktion schwarz. --Matthiasb 18:56, 16. Mai 2008 (CEST)[Beantworten]
Wenn Müll steht kann der Bot nur Müll ausspucken. Hier wären nur die Doppelpunkte weggekommen. Außerdem würde ich nur Überschriften zweiter Ebene anpacken. In diesem Fall also keine Änderung. Momentan warte ich mit dem Abarbeiten aber ehe wegen eines anderen Problems. --Euku:B 19:07, 16. Mai 2008 (CEST)[Beantworten]
Hallo, grundsätzlich können meiner Meinung nach alle Doppelpunkte am Ende von Überschriften rausgenommen werden, aber ich halte einen Botlauf allein hierfür für unnötig. Sowas mache ich seit Jahren neben größen Änderungen nebenher. Und zum Fettmachen dienen '''…''', nicht das Semikolon, siehe Hilfe:Textgestaltung. Den Einsatz von (einelementigen) Listen als Überschriftenersatz halte ich für semantischen Unfug. --Wiegels „…“ 19:36, 16. Mai 2008 (CEST)[Beantworten]
Ich sehe keinen Grund, weshalb der Lauf unnötig sein sollte. Es zeigt sich ja, dass es eben nicht möglich ist, das nebenher zu machen. Ebenso werden Typos ersetzt und die Personendaten überarbeitet, was man auch nebenbei erledigen könnte. Und das Argument, dass Versionsgeschichten vollgespammt und die Server belastet werden, zieht auch nicht mehr. Aktionsheld Disk. 12:31, 18. Mai 2008 (CEST)[Beantworten]
Natürlich ist es möglich, solche Änderungen nebenher zu machen, und ich bin nicht der einzige, der das macht. Wir sind uns aber einig darin, dass Bots diese Aufgabe zusätzlich ausführen sollten und dann auch die genannte Liste abarbeiten könnten. --Wiegels „…“ 13:10, 18. Mai 2008 (CEST)[Beantworten]

Vorschlag

Ich nehme mal an, dass Problem, dass irgendwo "Weblinks:" statt "== Weblinks ==" eingefügt wird, ist ein wiederkehrendes Problem. Es gibt sicherlich auch noch andere immer wiederkehrende "Unschönheiten" und "Unkonventionelle Schreibweisen" die sich durch einen einfachen Regex, wie dem oben, ersetzen lassen.

Mein Vorschlag wäre nun, eine Wikiseite anzulegen, welche eine Liste von solchen (einfachen) Regexs enthält und die von jedem Bot eingelesen und verarbeitet werden sollte. Ich denke da spontan an die Erweiterung der cosmetic_changes.py. Auf diese Weise lassen sich ohne separate Botläufe viele Kleinedits einsparen, oder? Gruß, --Rhodo Busch 21:01, 18. Mai 2008 (CEST)[Beantworten]

Die Idee finde ich wirklich gut. --APPER\☺☹ 00:50, 19. Mai 2008 (CEST)[Beantworten]
Schreibt die RegExps aber bitte so, dass auch ein Nicht-Python - Bot damit was anfangen kann, ja? ;) --Guandalug 01:39, 19. Mai 2008 (CEST)[Beantworten]
Der Syntax regulärer Ausdrücke unterscheidet sich ja nun nicht sooo extrem. Ich z.B. habe mit Python gar nichts am Hut, aber die Portierung zwischen PHP, JavaScript und .NET war bisher nie ein Problem (höchstens, ob ein Teil greedy oder ungreedy ist, ist teilweise anders) - ich habe aber bereits mehrfach teilweise Jahre alte Ausdrücke einfach in andere Sprachen übernehmen können. Naja und es ist häufig anders gelöst, wie genau man Ersetzungen macht, da sollten wir hier drauf achten. Aber ich denke, dass schon genug Leute darauf achten werden, dass das ganze Implementierungsunabhängig ist.
Ich habe hier in meinen Scripten verschiedenes gefunden:
&dagger; ->
[[Image: -> [[Bild:
Personendaten: Datumsangaben entlinken und ersten Parameterstrich in 2. Zeile, siehe Benutzer:APPER/removeLinksInPdDates
Vor allem bei Personenartikeln oft gut: automatisches DEFAULTSORT (natürlich nur, wenn die Sortierung für alle Kategorien gleich ist). Ist leider nicht mit einem RegEx getan, aber in C# sinds nur so 20 Zeilen (kann ich gerne irgendwo veröffentlichen)
--APPER\☺☹ 01:58, 19. Mai 2008 (CEST)[Beantworten]
Ergänzung: Leerzeichen zwischen "Kategorie:" und Kategoriennamen entfernen. Genau das gleiche gilt für [[Category und Kleinschreibung von [[kategorie oder auch schon gesehen [[KAtegorie. Macht auch die automatische Auswertung des Dumps leichter und schneller (wenn man auf case-insensitivität verzichten kann). --APPER\☺☹ 02:40, 19. Mai 2008 (CEST)[Beantworten]
Noch mehr Ideen (ich kritze hier einfach mal hin): Leerzeile zwischen DEFAULTSORT und Kategorien entfernen; Kategorie:Mann bzw. Frau bei Personenartikeln als letzte Kategorie. Leerzeichen bei Überschriften nach den öffnenenden == bzw. vor den schließenden ==. Achja und ich fänds cool, wenn in einer solchen Sammlung auch mal die Dinge des PyBots aufgenommen werden könnten. --APPER\☺☹ 03:10, 19. Mai 2008 (CEST)[Beantworten]
Was heißt "...die Dinge des PyBots aufgenommen werden könnten."? Gruß, --Rhodo Busch 15:50, 19. Mai 2008 (CEST)[Beantworten]
Also sämtliche kosmetischen Änderungen, die der python-bot automatisch macht. Dass die irgendwo mal dokumentiert werden, dass andere Botbetreiber 1) nicht dagegen arbeiten und 2) das gleiche machen können. --APPER\☺☹ 20:56, 19. Mai 2008 (CEST)[Beantworten]
Benutzer:BLueFiSH.as/JS/markup.js enthält einiges an Fixes, wird von PDDs monobook eingebunden. Aktionsheld Disk. 17:51, 19. Mai 2008 (CEST)[Beantworten]

Zu Personenartikeln bitte noch einmal nachfragen: Wikipedia:Formatvorlage Biografie schreibt dass, die Kats vom Speziellen zum Allgemeinen sortiert werden, d.h. Mann am Ende. --Farino 20:15, 19. Mai 2008 (CEST)[Beantworten]

Ja das schrieb ich ja auch: Kat:Mann ans Ende. --APPER\☺☹ 20:56, 19. Mai 2008 (CEST)[Beantworten]
Sorry, ich glaube ich sollte mal 'ne Pause machen. --Farino 23:25, 19. Mai 2008 (CEST)[Beantworten]
Was mir auch so aufgefallen ist bei Tabellen: neue Spalten die mit |----- eingeleitet werden haben ja keinen Layoutänderung zufolge, wenn man sie zu |- abändert. Außerdem können leere Spalten am Ende auch entfernt werden |- |} wird zu |}. Aber da Tabellen immer schnell zu zerstören sind, muss dies nicht umbedingt sein, wäre aber schön. Außerdem fallen mir immer mal unnötige Leerzeichen hinter den Kategorien etc. auf. Kann man diese auch automatisch entfernen, als normaler Bearbeiter findet man sie schlecht (Sprich: Ein trim/glätten auf jede Zeile). Weiß nicht ob das schon gemacht wird, am artikelende ist ja eine bestimmte Reihenfolge: Navi - kat - PD - interwiki, sehe ich auch oft anders. Außerdem: Infoboxen mit Parametertrenner am Zeilenende, hier wäre er am Zeilenanfang besser, meist kann dann ein unnötiger Parametertrenner am Ende entfallen (|}} wird zu }} - alleine in einer eigenen Zeile). Lässt sich einiges umsätzen? Der Umherirrende 22:22, 19. Mai 2008 (CEST)[Beantworten]
Ein oder mehrere Leerzeichen vor "New Line" können doch eigentlich immer entfernt werden. Andim 14:37, 20. Mai 2008 (CEST)[Beantworten]
Leerzeichen am Zeilenende werden vom PyWikipediaBot automatisch entfernt, wenn in der user-config.py cosmetic_changes=True gesetzt ist. --Head 02:15, 24. Mai 2008 (CEST)[Beantworten]

Ansatz (Damit es hier endlich mal vorrangeht ;o) )

Darf ich mal Fragen, wie es bis jetzt so aussieht? Ich könnte ja meinen Java-basierten bot mal für diese kosmetischen Änderungen abkommandieren ;) Wie sieht es aus mit der regex-liste, die oben angesprochen wurde? Ich habe jetzt ganz einfach mal den Ansatz für die Liste gewagt (hat bisher nur den erwähnten eintrag) : Benutzer:Deadbot/regex Gedacht ist, dass das ganze zeilenweise notiert wird:

<pre>
regex1
korrektur1
regex2
korrektur2
regex3
korrektur3

die pre-tags einfach nur der schönheit halber, damit es auf der Seite in der normalansicht nicht allzu chaotisch aussieht. Allerdings bin ich mir nicht sicher, ob ich die Zeilenweise notation beibehalten möchte. Hat jemand eventuell bessere Vorschläge? Ich weis nicht, welche zeichen alles in den regenechsen verwendet werden, also kann ich nicht sagen, womit man regex und korrektur voneinander trennen könnte, vlt kann mir da ja mal jemand weiterhelfen. Wenn wir uns dann auf eine Form geeinigt haben, möchte ich natürlich alle einladen, sich frei zu fühlen an der liste mitzuwirken ;)

--Stummi(D|B) 20:29, 26. Mai 2008 (CEST)[Beantworten]

Nicht das wir aneinander vorbeireden! Gedacht ist kein Bot, der ausschließlich kosmetische Änderungen durchführt! Wenn, so sollen die jeweiligen Bots bzw. Frameworks angepasst werden, dass sie nebst einer geplanten Änderung, z.B. Interwiki-Links setzen, die Änderungen der geplanten Liste zusätzlich, quasi en passant, durchführen.
Zudem wäre die Liste imho als Unterseite von Wikipedia:Bots angebrachter (z.B. Wikipedia:Bots/Liste kosmetischer Änderungen), zur Entwicklung ist sie im Benutzernamensraum aber gut aufgehoben.
Ein Format, dass auch für Menschen lesbar ist, sollte angestrebt werden. Ich werde gleich mal einen Vorschlag auf Deine Seite posten!
Gruß, --Rhodo Busch 21:47, 26. Mai 2008 (CEST)[Beantworten]
Hoi, dein Vorschlag sieht schonmal recht gut aus. Ich vermute mal, du hast es so gedacht, dass Leerzeilen und Zeilen mit Raute für bots einfach übersprungen werden? Ich wollte gerne mit vorsehen, dass die notation relativ Fehlerresistent ist. Sonst könnte sich durch z.B. eine fälschlicherweise auskommentierte od. gelöschte Zeile die ganze Liste um eine Zeile verschieben. So könnte es z.B. passieren, dass die Bots korrekturzeilen als regex und umgedreht einlesen, was im worst-case wohl zu einem unberrechenbaren amoklauf auf Artikel ausarten könnte ;) Deswegen würde ich gerne mit vorsehen, dass regex's und korrekturzeilen irgendwie unterschiedlich markiert werden.

z.B. so:

# kommentar
R: regex
C: korrektur

--Stummi(D|B) 22:19, 26. Mai 2008 (CEST)[Beantworten]

Genau. Ich dachte, Leerzeile(n) als Trenner zwischen einzelnen Zeilen. Kommentare (auch mehrzeilig) mit Raute davor. Eine Differentation zwischen Regex und Korrekturzeile ist auch gut. Ich würde das C (ich denke, Du meinst Correction) jedoch in ein K (für Korrektur) umwandeln, da wir hier in der deutschsprachigen WP sind. Oder RE und KO...
Lieber wäre mir noch eine Notation, die nur eine Zeile erfordert. Vll. so:
RE: [ ]?([^=]+):[ ]? KO: $1
Nur wüsste ich da ad hoc keine Methode um Missverständnisse zwischen Regex-Teil und Korrekturteil zu vermeiden. Ich denke da an einen Regex der nach "KO:" sucht, sollte aber relativ selten vorkommen.
Der Vorteil an einer einzeiligen Notation wäre, dass man problematische oder diskutable Regexe einfach auskommentieren kann und dabei nicht vergisst, den Korrekturteil mit auszukommentieren.
Bei einer zweizeiligen Notation würde ich eine Notation begrüßen, die zusammengehörige Paare kennzeichnen kann, so dass nicht durch das Vergessen von einer R- oder C-Angabe dass System durcheinander gebracht wird. Gruß, --Rhodo Busch 23:37, 26. Mai 2008 (CEST)[Beantworten]
Ich bin leider kein allzu großer regex-Kenner. Man müsste sich ja nur mal nach einem Zeichen kundig machen, das in den regexes nie vorkommen kann, und das dann als Trennzeichen verwenden. Damit hätten wir unsere einzeilige Notation --Stummi(D|B) 14:20, 27. Mai 2008 (CEST)[Beantworten]
Ich bin noch mal in mich gegangen und dabei ist mir noch was eingefallen: Eine mehrzeilige Syntax ist sinnvoller: Man kann dann später noch Optionen hinzufügen, z.B. den Beschreibungstext, den der Bot in die Zusammenfassungszeile klatscht, wenn er eine Aktion durchführt. Ausserdem verliert man so nicht den Überblick wenn man die Seite bearbeitet.
Ich habe auch mal einen Absatz in deine Seite eingefügt, wo schon mal Regexe samt Korrekturen gesammelt werden können.
Gruß, --Rhodo Busch 21:14, 27. Mai 2008 (CEST)[Beantworten]

Gesichtete und geprüfte Versionen - Datenfehler in Spezialseiten

Dieser Botauftrag wird gerade von --Guandalug 19:21, 23. Mai 2008 (CEST) bearbeitet. Um Konflikte zu vermeiden, warte bitte mit anderen Aktionen, bis diese Markierung entfernt ist, oder kontaktiere den Betreiber.[Beantworten]

Das neue Feature "Gesichtete und geprüfte Versionen" verursachte Dateninkonsistenzen in den Spezialseiten Spezial:Linkliste. Bei gesichteten Versionen wurde die zugehörige Datenbanktabelle bei Änderungen an Wikilinks nicht aktualisiert. Siehe: Diskussion Benutzerseite P. Birken bzw. Diskussion Gesichtete und geprüfte Versionen.

Kann jemand eine Nullspeicherung (ohne Versionserzeugung) bei allen bisher gesichteten Artikel (6. Mai bis einschl. 14. Mai 2008) durchführen? Es gibt bzw. gab wohl schon ein Python-Script (touch.py) für Bots.--Video2005 21:58, 15. Mai 2008 (CEST)[Beantworten]

Falls es jemand machen möchte: Das Script touch.py liegt im archive-Verzeichnis von PyWikipediaBot, weil davon ausgegangen worden war, dass es nicht mehr benötigt werden würde. --Head 22:23, 15. Mai 2008 (CEST)[Beantworten]
Ebenfalls hier: Wenn bis Montag keiner will, dann schau ich mal. Auch wenn ich noch nicht weiss, wie ich die gesichteten Artikel mit Sichtungsdatum vor dem 15. Mai filtern kann - da finde ich schon 'ne Lösung. Die touch.py hilft mir allerdings nichts.... :D --Guandalug 09:28, 16. Mai 2008 (CEST)[Beantworten]
Sodale, das ging leichter als gedacht. Mit Log-Zugriff und Filter auf 'review' - Einträge komme ich an die Artikel, und "bearbeitet" werden nur diejenigen Artikel, wo die "Sichtungs-Version" (pageID) auch die aktuelle Version ist. Zur Zeit läuft ein Read-Only testlauf, um mal Zahlen zu bekommen - natürlich schön gemächlich. --Guandalug 17:49, 18. Mai 2008 (CEST)[Beantworten]
Na das hört sich doch alles sehr gut an! Danke für deine Bemühungen. --Video2005 18:03, 18. Mai 2008 (CEST)[Beantworten]
Ich habe den Bot jetzt gestartet, mit Null-Edits (hoffe ich). Erwartete Laufzeit: Mehrere Tage. --Guandalug 11:44, 19. Mai 2008 (CEST)[Beantworten]
Spitze!! Ich bin dann mal gespannt wann der Programmlauf fertig ist.--Video2005 20:29, 19. Mai 2008 (CEST)[Beantworten]
Der Bot ist durch - seit heute früh, 6:41 Uhr. Nullbearbeitete Seiten: 10.511 (alle anderen gesichteten waren entweder später oder hatten nach dem 14. Mai noch Bearbeitungen / Sichtungen. --Guandalug 13:08, 23. Mai 2008 (CEST)[Beantworten]
Hat sich was.... Ich hab das Limit der API-Query erreicht, nicht das Ende des Botlaufs. Er macht weiter..... Schön langsam und unauffällig. --Guandalug 19:21, 23. Mai 2008 (CEST)[Beantworten]
Der Bot hat auf jeden Fall noch einiges zu tun. Ich habe noch ein paar Beispiele die darauf warten korrigiert zu werden. --Video2005 19:07, 24. Mai 2008 (CEST)[Beantworten]

Hinweis auf PyWikipediaBot-Update

Hallo,

ein kleiner Hinweis an alle, die hier einen PyWikipedia-Bot betreiben: es gibt ein wichtiges Update, bitte einspielen. Details hier. --Head 20:45, 16. Mai 2008 (CEST)[Beantworten]

Nach Wikipedia:NEU#19. Mai wohl nicht mehr nötig? --Aktionsheld Disk. 17:43, 20. Mai 2008 (CEST)[Beantworten]
Doch, ich denke schon. Die 'Zwischenversion', auf die viele aktualisiert haben, hat einen Fehler (liefert eine falsche baseRevId, wenn ich das richtig lese).... Obendrein, schaden kann es wohl kaum ;) --Guandalug 19:11, 20. Mai 2008 (CEST)[Beantworten]

Syntaxkorrekturen

Ich lasse ab und zu Zwobot Syntaxkorrekturen vornehmen, z. B. Wikilinks, bei denen eine schließende eckige Klammer fehlt etc. Das ist aber zu viel Arbeit für einen einzelnen, ich schaffe es nie, einen ganzen XML-Dump durchzuarbeiten. Wäre also schön, wenn noch jemand das ab und zu in Angriff nehmen würde. So geht's:

  • Dump von [2] runterladen: Articles, templates, image descriptions, and primary meta-pages, entpacken
  • Zunächst vollautomatisch die gefahrlosen Änderungen machen: python replace.py -namespace:0 -fix:syntax-safe -always -xml:dewiki-20080422-pages-articles.xml
  • Dann die nicht sicheren Änderungen einzeln bestätigen: python replace.py -namespace:0 -fix:syntax -xml:dewiki-20080422-pages-articles.xml

Bei den nicht sicheren Änderungen gibt es ca. 10 % falsche positive, zum Beispiel bei URLs, die regulär Vertikalstriche beinhalten oder an Stellen, wo eckige Klammern für etwas anderes als für Links verwendet wurden. Deshalb muss hier jede Änderung manuell bestätigt werden. --Head 22:37, 16. Mai 2008 (CEST)[Beantworten]

Anfrage vom Support-Team

Liebe Bot-Betreiber,
im Support-Team (ehemals OTRS-Team) ist eine Freigabe für alle Bilder des Benutzers Rebou (siehe auch Logbuch) eingetroffen. Ich bin Bottechnisch absoluter Laie, wie Euku/Spongo aus Erfahrung weiß, von daher, lacht mich bitte bei der nächsten Frage nicht aus: Ist es möglich, dass ein Bot in jedes seiner hochgeladenen Bilder auf Wikipedia die Vorlage {{OTRS|16. Mai 2008|2008051610002328|--[[Benutzer:My name|my name}} in den Vorlagenabschnitt "Genehmigung" der Informationsvorlage sowie (falls nicht vorhanden) als (einzige) Lizenz {{Bild-GFDL}} einsetzt? Sowie am besten auch bei den auf Commons verschobenen Bildern die Vorlagen {{permissionOTRS|2008051610002328}} --[[Benutzer:My name|my name]] in die dortige Informationsvorlage unter "permission" und {{GFDL}}? Danke für eure Hilfe schon im Voraus, my name 03:53, 23. Mai 2008 (CEST)[Beantworten]

das wird echt ne harte Nuss...ich schau mal was ich machen kann...nachdem ich da aber erst was händisch rummachen muss: wenn jemand schon nen fertigen bot hat, möge er gern übernehmen...HardDisk rm -rf 10:49, 23. Mai 2008 (CEST)[Beantworten]
Mit 'nem fertigen Bot dafür kann ich auch nicht dienen - das ist in jedem Fall Handarbeit und selbercoden. Mein Framework würde das unterstützen, aber... Mach du mal :D --Guandalug 13:30, 23. Mai 2008 (CEST)[Beantworten]

{{InuseBot|[[Benutzer:HardDisk|HardDisk]] <sup>[[Benutzer Diskussion:HardDisk|rm -rf]]</sup> 23:15, 23. Mai 2008 (CEST)}}

ich mach morgen weiter. HardDisk rm -rf 23:37, 23. Mai 2008 (CEST)[Beantworten]
Danke! --my name 23:50, 23. Mai 2008 (CEST)[Beantworten]
Dieser Botauftrag wird gerade von HardDisk rm -rf 19:08, 24. Mai 2008 (CEST) bearbeitet. Um Konflikte zu vermeiden, warte bitte mit anderen Aktionen, bis diese Markierung entfernt ist, oder kontaktiere den Betreiber.[Beantworten]