Wikipedia:Sarcini pentru roboți
Aceasta este o pagină în care puteți trimite cereri pentru a fi realizate de către un robot. Acesta este locul în care puteți adăuga idei pe care apoi roboții să le materializeze. Tot aici trebuie adăugate sarcinile pe care doriți să le realizați folosind un cont care are deja flagul de robot.
Dacă nimeni nu exprimă vreo observație asupra unei cereri într-o săptămână de la depunere, se consideră că cererea respectivă poate fi implementată. în caz contrar, trebuie să se ajungă la consens în privința cererii inainte de rularea robotului.
Vă rugăm adăugați cererea dumneavoastră la sfârșitul paginii.
Dacă sunteți operator de robot și finalizați o cerere, vă rugăm să o arhivați. Cererile care nu mai sunt relevante trebuie arhivate după un timp.
Arhiva cererilor realizate:
Sarcini permanente
Mai jos sunt trecute cererile care trebuie rulate regulat dar nu au fost preluate încă de niciun operator de robot.
Pagini cu legături invalide către fișiere
S-au adunat multe pagini în Categorie:Pagini cu legături invalide către fișiere. Era mai demult un robot care le scotea, însă nu mai rulează.— Ionutzmovie discută 23 august 2016 19:05 (EEST)
- Am realizat operațiunea manual, însă mai apar câteva pagini. Cred că nu mi le-a afișat pe toate în categorie atunci când am terminat curățarea ei, iar o altă parte din articole au categoria pentru că cei de la Commons par să nu ruleze întotdeauna CommonsDelinker.— Ionutzmovie discută 29 ianuarie 2017 07:10 (EET)
Protejări expirate
Ar trebui să existe un robot care să elimine periodic lacătul din paginile listate la Categorie:Pagini a căror protecție a expirat. --NGC 54 (discuție / contribuții) 17 aprilie 2021 17:49 (EEST)
Import linii de transport în comun
Plecând de la o discuție anterioară despre actualizările oarecum haotice ale liniilor STB, aș vrea să explorăm împreună un bot de import automat al datelor, acolo unde sunt disponibil în format prelucrabil automat. Împreună înseamnă că invit pe oricine să completeze informațiile de mai jos cu idei și informații noi.--Strainu (دسستي) 4 noiembrie 2024 00:03 (EET)
Surse și formate de date
Mă aștept ca majoritatea surselor de date să fie en:GTFS. E un format standardizat bine cunoscut, pentru care există deja biblioteci Python ce pot fi folosite. Din punct de vedere al drepturilor de autor, consider că este vorba de simple fapte sau date ce nu pot fi protejate. Cu privire la drepturile fabricanților bazelor de date, nu voi extrage decât informații despre linii și unele stații, adică o parte mică din totalul informațiilor disponibile.
Actualizarea informațiilor va fi în funcție de sursă, de obicei la 1 săptămână.--Strainu (دسستي) 4 noiembrie 2024 00:03 (EET)
- Listă de surse de date
- Zona Metropolitană București: https://gtfs.tpbi.ro/regional/ - fără licență
- Cluj, Iași, Timișoara, Botoșani, Chișinău: https://tranzy.ai - licență liberă, dar custom și cu atribuire către platformă
- Iași: https://gps.sctpiasi.ro/json [nefuncțională]
- Sibiu: https://www.tursib.ro/trasee/gtfs
- Constanța: https://info.ctbus.ro/rp/api/lines/ [nefuncțională], https://external.gtfs.ro/constanta/ (sursă terță)
- Brașov: https://github.com/szjozsef/osm2gtfs/ (din OSM!)
- Mai multe orașe din surse terțe: https://mobilitydatabase.org/feeds?q=Romania
- CFR (anual): https://data.gov.ro/organization/sc-informatica-feroviara-sa - XML, nume diferit per an. Sursă terță GTFS pe github
- ...
Întrebări deschise:
- Folosim sursele terțe? Ce fel de atribuire oferim?
- Cum putem folosi datele CFR? Ele se referă la trasee (trenuri în limbajul comun), nu la magistrale.--Strainu (دسستي) 4 noiembrie 2024 17:01 (EET)
Detalii despre implementare
Robotul va actualiza liste de linii cu sau fără capete, formate de numărare a liniilor precum {Număr linii tramvai STB} și liste de stații ale unor linii.
- Liste de linii și de stații
Pentru a marca zonele ce trebuie actualizate vom folosi formate, exact ca în listele Listeria. Formatul de sfârșit e fără parametri, folosit doar pentru identificarea zonei de actualizat, iar cel de început va conține următorii parametri:
rețea
- reprezintă sursa de date (oraș/zonă)companie
tip_enumerare
:linie
(listă cu virgule, pe rând),listă_simplă
(listă cu • , include și capetele liniei),listă_numerotată
(listă cu numere, include și capetele liniei),schemă
(scheme de traseu precum la {Metrou ușor în București — linia 41}[a]),număr
[b],tabel
(pentru SCTP Iași)tip_rută
(autobuz, troleibuz, tramvai, metrou, toate)număr_rută
- util pentrutip_enumerare=schema
.output_colorat
- da/nu. Dacă da și există culori în GTFS, se folosesc acele culori.
- ^ Cel puțin în primă fază robotul nu va putea genera scheme mai complexe, precum la Linia 44 de tramvai din București (conexiuni, poduri etc.)
- ^ TBD cum ne asigurăm că formatele de marcare nu au output în acest caz. E important pentru că formatele de numere sunt apoi introduse în anumite expresii matematice.
- Verificări
Robotul trebuie să poată raporta pe wiki (TBD unde...) toate paginile actualizate într-o rulare anterioară și care nu au mai fost actualizate în rularea curentă, împreună cu orice erori au apărut. În felul acesta vom putea identifica rapid vandalismele scăpate la patrulare.--Strainu (دسستي) 4 noiembrie 2024 00:03 (EET)
Ar trebui să verificăm și contrastul dintre culoarea liniei și background (ori cel din GTFS, ori cel din tabel/pagină).--Strainu (دسستي) 5 noiembrie 2024 13:04 (EET)
Probleme apărute
- Capetele de linii sunt fără diacritice în toate orașele.--Strainu (دسستي) 26 noiembrie 2024 08:55 (EET)
Pagini de dezambiguizare pentru comune
Ar trebui făcute redirectări pentru pagini de dezambiguizare pentru comune.
De exemplu pagina Comuna Brăești ar trebui să redireceze către pagina Brăești, pentru că există următoarele comune:
— Ark25 (discuție) 3 decembrie 2016 20:12 (EET)
- O am în backlog demult. Pentru cele din România se pot face relativ rapid. —Andreidiscuție 4 decembrie 2016 09:23 (EET)
M-am uitat un pic pe situația existentă pentru comunele din România (rezumat aici) și văd mai multe probleme:
- Sunt cel puțin 3 țări de care trebuie ținut cont: România, Republica Moldova și Ucraina. Nu m-ar mira să mai fie și în Ungaria și Serbia câte ceva.
- Există mai multe situații curente:
- Redirecționare spre o pagină generică de redirecționare
- Redirecționare spre o pagină de redirecționare specifică pentru comune
- Redirecționare spre un articol (pe astea le-am șters la grămadă pentru a face loc unor redirecționări corecte când decidem cum facem)
- Paginile de dezambiguizare generice amintesc doar de sat, nu și de comună (formularea standard e X, Jud. este satul de reședință al comunei cu același nume, dar nu toate o folosesc)
Având în vedere cele de mai sus, redirecționarea către paginile generice pare cea mai simplă soluție, dar nu neapărat cea mai bună. Poate ar merita investit în separarea paginilor de dezambiguizare pentru comune/sate/altele? Suplimentar (sau alternativ) ar trebui uniformizate și numele paginilor generice de dezambiguizare.--Strainu (دسستي) 3 iunie 2019 00:15 (EEST)
Localități
Se mai ocupă cineva cu crearea de articole despre localitățile lumii? Am sperat că munca lăudabilă depusă de Andrei Stroe la așezările din Ucraina va fi continuată de alți posesori de roboți, dar constat că s-a oprit. Crearea manuală de articole despre localități este greoaie și neproductivă. Măcar unul sau două state pe an și tot ar fi un progres. --Haptokar (discuție) 20 august 2017 13:45 (EEST)
- Eu m-am oprit o vreme pentru că oricum e necesară o schimbare de paradigmă în lumina apariției proiectului Wikidata. —Andreidiscuție 21 august 2017 10:19 (EEST)
- Înțeleg. Necesitatea creării articolelor rămâne totuși. --Haptokar (discuție) 21 august 2017 10:41 (EEST)
Dacă va fi reluat acest plan, aș vrea ca articolul-model să nu mai conțină {ill} și prietenii. E inutil să creăm zeci de mii de formate care să devină inutilă cu un simplu ciot. Mai bine îl creăm de la început și folosim legături interne.--Strainu (دسستي) 30 noiembrie 2018 12:39 (EET)
Orașe în/din Germania
E nevoie de înlocuirea formatului învechit {Cutie Localități DE} (și redirectului său {Infobox German location}) cu formatul standard {Infocaseta Așezare}. Formatele vechi au dezavantajul că întroduc în pagini și categoriile cu denumirea după tipicul Orașe în.
Este vorba de următoarele categorii:
- Categorie:Orașe în Baden-Württemberg
- Categorie:Orașe în Bavaria
- Categorie:Orașe în Brandenburg
- Categorie:Orașe în Hessa
- Categorie:Orașe în Mecklenburg-Pomerania Inferioară
- Categorie:Orașe în Renania de Nord-Westfalia
- Categorie:Orașe în Renania-Palatinat
- Categorie:Orașe în Saxonia
- Categorie:Orașe în Saxonia Inferioară
- Categorie:Orașe în Saxonia-Anhalt
- Categorie:Orașe în Schleswig-Holstein
- Categorie:Orașe în Turingia
--Mihai (discuție) 3 septembrie 2020 09:30 (EEST)
- Soluția imediată a problemei în/din e Special:Diff/13593906. // Gikü vorbe fapte 3 septembrie 2020 09:35 (EEST)
Secțiune goală
Ar fi util un robot care să (mai) adauge {Secțiune goală} acolo unde este cazul. --Terraflorin (discuție) 3 februarie 2021 10:49 (EET)
- Eroarea respectivă de la CheckWiki este dezactivată. Există o altă metodă de a genera lista de pagini cu secțiuni goale? // Gikü vorbe fapte 3 februarie 2021 12:41 (EET)
- Poate o mică programare care să verifice dacă după == urmează din nou (peste un rând două mai jos) tot == --Terraflorin (discuție) 19 februarie 2021 15:52 (EET)
Following tools can correct the problem:
AutoWikiBrowser (AWB) (most, but not all cases)
--Terraflorin (discuție) 19 februarie 2021 15:56 (EET)
- @Gikü mai vrei să te ocupi de această cerere? Strainu (دسستي) 10 decembrie 2024 17:53 (EET)
- Cum? Așa și nu știu cum să generez lista de pagini cu această problemă. // Gikü vorbe fapte 10 decembrie 2024 18:02 (EET)
- Nu poți rula pe toate paginile din site? Eu așa fac cu PWB când nu știu unde e eroarea. Strainu (دسستي) 10 decembrie 2024 18:06 (EET)
- A, nu, cel puțin nu cu AWB. // Gikü vorbe fapte 10 decembrie 2024 18:27 (EET)
- Nu poți rula pe toate paginile din site? Eu așa fac cu PWB când nu știu unde e eroarea. Strainu (دسستي) 10 decembrie 2024 18:06 (EET)
- Cum? Așa și nu știu cum să generez lista de pagini cu această problemă. // Gikü vorbe fapte 10 decembrie 2024 18:02 (EET)
Lista Roșie a IUCN
Poate înlocui cineva „lista roșie a IUCN” și „Lista roșie a IUCN” cu „Lista Roșie a IUCN”? Denumirea din urmă pare mai răspândită: https://scholar.google.com/scholar?hl=ro&as_sdt=0%2C5&q=%22Lista+ro%C8%99ie+a+IUCN%22&btnG=.
- https://ro.wikipedia.org/w/index.php?search=%22Lista+ro%C8%99ie+a+IUCN%22&title=Special:C%C4%83utare&profile=advanced&fulltext=1&ns0=1
- https://ro.wikipedia.org/w/index.php?search=%22Listei+ro%C8%99ii+a+IUCN%22&title=Special:C%C4%83utare&profile=advanced&fulltext=1&ns0=1
--NGC 54 (discuție|contribuții) 19 februarie 2023 17:12 (EET)
@NGC 54: înainte de asta, consultați-vă vă rog în prealabil cu Nicu Farcaș.--Accipiter Gentilis Q.(D) 19 februarie 2023 17:26 (EET)
- @Nicu Farcaș: Aveți vreo opinie despre această chestiune? --NGC 54 (discuție|contribuții) 17 martie 2023 18:06 (EET)
- @NGC 54: Deși pare mai răspândită denumirea: „Lista Roșie a IUCN”, prefer varianta: „Lista roșie a IUCN” (pentru ro.wp). -- Nicu Farcaș(mesaj) 17 martie 2023 21:48 (EET)
- @Nicu Farcaș: Care este motivul? --NGC 54 (discuție|contribuții) 17 martie 2023 22:06 (EET)
- @NGC 54:: Mi-am exprimat doar o părere (folosirea/utilizarea majusculelor în engleză și preluarea acestora odată cu traducerea în alte limbi/ex: franceză Liste rouge de l'UICN), italiană Lista rossa IUCN, etc). -- Nicu Farcaș(mesaj) 17 martie 2023 23:49 (EET)
- @Nicu Farcaș: Care este motivul? --NGC 54 (discuție|contribuții) 17 martie 2023 22:06 (EET)
- @NGC 54: Deși pare mai răspândită denumirea: „Lista Roșie a IUCN”, prefer varianta: „Lista roșie a IUCN” (pentru ro.wp). -- Nicu Farcaș(mesaj) 17 martie 2023 21:48 (EET)
Actualizare secțiune demografie Bulgaria
Andrei Stroe, se pot actualiza secțiunile de demografie pentru localitățile din Bulgaria? Rezultatele recensământului din 2021 sunt aici. Strainu (دسستي) 8 mai 2024 20:51 (EEST)
- Am văzut mesajul, e în coadă, nu știu când mă apuc. Dar o să anunț. —Andreidiscuție 23 ianuarie 2025 09:54 (EET)
Dezvoltări noi pentru PatrocleBot
Salutare. Pe lângă capacitățile de patrulare automată ce vor fi preluate la un moment dat de extensia Autoreverter, aș dori să adaug câteva capabilități noi lui Patrocle:
- Mentenanța formatelor din familia {protejat} (adăugare atunci când o pagină e protejată, scoatere când expiră o protejare)
- Adăugarea formatului {bpv} pentru articolele nou create care au un element Wikidata asociat cu este un/o (P31)=om (Q5) / data nașterii (P569) cu o valoare specificată și data decesului (P570) inexistent, respectiv scoaterea zilnică a formatului din paginile cu decese recente.
- Îmbunătățirea avertismentelor din WP:AA prin folosirea sistemului de urmărire al vandalilor deja existent: atunci când se face o reclamație pentru utilizator, informația este păstrată în perioada de urmărire până la expirare (în prezent 1h) și nu se mai fac alte reclamații în această perioadă.
- Identificarea limbii articolelor noi și marcarea articolelor în alte limbi cu
{șr-a2}{șr|Articol în altă limbă decât româna} (experimental pare să meargă, vom vedea cum funcționează la scară mare) - Marcarea cu {șr-g3} atunci când nu se poate face revenirea pentru că există un singur autor al articolului.
Disclaimer: intenționez să cer un grant pentru dezvoltările acestea. Strainu (دسستي) 20 ianuarie 2025 20:32 (EET)
- @Strainu: {Șr-a2} s-ar putea să nu fie cel mai potrivit mesaj în cazul acesta, fiindcă mesajul său este Conținutul este copiat de la alt proiect Wikimedia., iar PatrocleBot, din câte înțeleg, ar analiza doar limba conținutului, nu și dacă conținutul respectiv se găsește și pe alt proiect.
- De acord, în rest. --Paloi Sciurala (discuție|contribuții) 21 ianuarie 2025 16:35 (EET)
- Am înlocuit.--Strainu (دسستي) 23 ianuarie 2025 09:49 (EET)
- @Strainu: Unele articole sunt vandalizate într-un interval foarte scurt de timp de mai mulți vandali. De exemplu aici. PatrocleBot a anulat numai vandalismele celui mai recent vandal. Atunci când un articol a fost vandalizat, iar ultima editare a fost făcută de PatrocleBot, cel care se uită la istoric (sau schimbări recente) probabil se va gândi „Lasă, că s-a ocupat Patrocle”, fără a își da seama că Patrocle nu a dus treaba la bun sfârșit. Se poate face ceva și în privința asta? --Paloi Sciurala (discuție|contribuții) 26 ianuarie 2025 17:46 (EET)
- Pe scurt: nu. Patrocle prinde doar editările care ar fi aproape sigur anulate de un om, însă patrulatorii trebuie să verifice în continuare ce s-a întâmplat.
- Pe lung: în cazul de față Patrocle nu a ratat primele 2 vandalisme, însă scorurile erau sub pragul de anulare. Pragul este ales în așa fel încât să minimizeze anulările false și să ajute patrulatorii. Când ai un data engineer la îndemână calculezi 2 parametri numiți precision și recall și cauți să le maximizezi pe ambele. Eu am făcut niște experimente ca să ajung aici. Putem să ne mai jucăm cu scorul să vedem câte reclamații primim, nu necesită modificări de cod.
- Dacă editările chiar ar fi fost prea rapide pentru bot, mai puteam umbla la parametrii
rc_interval_min
șirc_interval_max
din MediaWiki:Revertbot.json ca să-l facem mai rapid. - La modul general însă, nu vrei să lași robotul să editeze modificări vechi. Să zicem că am întâlnit următoarea succesiune:
- user A - vandalism 1
- user B - corect, ceva legat de vandalism 1
- user A - vandalism 2
- Robotul poate acționa în 3 moduri:
- revine la versiunea anterioară acestor modificări - nu e OK, că a anulat o contribuție corectă
- face revert - asta face acum
- face revert, apoi încearcă să anuleze vandalism 1, dar eșuează, sau și mai rău, nu eșuează dar face ca modificarea lui user B să nu mai aibă sens.
- Varianta 2 e singura care nu poate introduce probleme. Sigur, dacă și a doua editare e tot a lui user A, tot am anulat o contribuție corectă, dar asta se întâmplă extrem de rar (în general când nu e vorba de vandalism, ci de editări greșite de bună credință) Strainu (دسستي) 26 ianuarie 2025 21:33 (EET)
- @Strainu: Unele articole sunt vandalizate într-un interval foarte scurt de timp de mai mulți vandali. De exemplu aici. PatrocleBot a anulat numai vandalismele celui mai recent vandal. Atunci când un articol a fost vandalizat, iar ultima editare a fost făcută de PatrocleBot, cel care se uită la istoric (sau schimbări recente) probabil se va gândi „Lasă, că s-a ocupat Patrocle”, fără a își da seama că Patrocle nu a dus treaba la bun sfârșit. Se poate face ceva și în privința asta? --Paloi Sciurala (discuție|contribuții) 26 ianuarie 2025 17:46 (EET)
- Am înlocuit.--Strainu (دسستي) 23 ianuarie 2025 09:49 (EET)
Articole despre planete minore
După modelul de la NGC, doar planetele minore cu nume. Query: [1] (doar pentru asteroizi), format {articol asteroid}, articol exemplu 11019 Hansrott. Număr de articole: necunoscut, între 7.000-25.000. Strainu (دسستي) 23 ianuarie 2025 20:37 (EET)