Utente:Pracchia-78/AWB/Registro
A partire da circa il 22 o 23 agosto 2012 i server sembrano non disconnettere più AWB a seguito di una pausa operativa di durata di alcuni secondi. Nel corpo del testo, redatto prima della data indicata, accenno a quell'inconveniente e alle sue ripercussioni quando si eseguono modifiche manuali nell'edit box del software. Ho altresì rilevato che le modifiche aggiuntive a mano (nell'esempio: l'aggiunta di maiuscola a inizio del periodo) non intaccano il campo oggetto, diversamente da quanto esposto nel testo. Questo avviso è inteso come temporaneo ed è inserito in attesa di una conferma e dell'esito complessivo di una serie di prove.
Dal 2008 mi occupo di correzioni di errori sulle voci di Wikipedia tramite il browser del sistema operativo del mio PC; dalla metà del 2010 suddivido i miei contributi con un editor semiautomatico, AWB nella versione 5.2.0.0 (e successive), che mi permette di eseguire operazioni altrimenti impossibili con il solo browser e con concreti risultati [1] anche sotto il mero aspetto quantitativo fissato per regolamento a 60 modifiche orarie [2].
In questa pagina si trova un test del 3 aprile 2012 (seguito da altri) condotto con AWB nella versione 5.3.1.0 [3]: lo scopo è un tentativo di quantificare la probabile percentuale di errori ortografici, di refusi e di formattazione presenti nelle pagine principali, cioè nelle voci dell'enciclopedia utilizzando specifiche condizioni di ricerca degli stessi. Ho inserito anche una serie di descrizioni di situazioni nelle quali mi sono imbattuto: esse sono dei semplici ma utili(zzabili) promemoria tratti dalla quotidianità, possibili fonti di spunto per altre idee e migliorie inerenti al settore di cui mi occupo in modo prevalente.
Se altri Utenti hanno esperienze simili sono grato se me le comunicheranno in quest'altra pagina.
Generazione della lista
[modifica | modifica wikitesto]Tramite AWB ho selezionato l'opzione che permette di cercare con criterio casuale dieci voci nell'enciclopedia. Cliccando ripetutamente su make list ho ottenuto una lista[4] di 2 000 voci accessibile tramite questo collegamento. La lista è stata subito salvata sul mio pc con la formattazione tipica di Wikipedia, in un file nominato Random.txt.
Dal campo Souce dal menu a discesa ho scelto Text file: (UTF-8) e per sincerarmi che non vi fossero errori ho caricato di nuovo in memoria il contenuto del Random.txt previa cancellazione della lista poco prima generata da AWB.
Elaborazione della lista
[modifica | modifica wikitesto]Per l'elaborazione ho seguito la consueta procedura standard caricando prima di tutto i Typos presenti sul server di Wikimedia tramite caricamento del file settings.xml (contenente le regex e la lista dei Find and replace) per infine interrogare il server con le mie credenziali (nome utente e password) sul progetto it.wikipedia). Una volta accettato, AWB ha iniziato a caricare in memoria il contenuto del primo elemento della lista.
Particolarità emerse durante il lavoro
[modifica | modifica wikitesto]La lista di lavoro mi offriva pagine in NS-0 nelle quali non era possibile né stabilire né intuire a priori quali tipi di errori ortografici, refusi o di formattazione avrei trovato per il semplice motivo che la lista era stata generata con criterio casuale da AWB tramite una serie di interrogazioni al database di it.wikipedia.[5]. Tuttavia visto l'elevato numero di voci contenute nella lista e la generosa dimensione del mio settings.xml, vi era fin da principio l'assoluta garanzia di trovare un generico lavoro per AWB e per di più quantitativamente interessante.[6].
La fase di sostituzione delle parole errate, di correzione di template e delle entity si è svolta nel rispetto dell'attuale policy d'uso prevista per le utenze prive di flag e, per quanto attiene l'aspetto tecnico, senza che il software si "congelasse" nel caricare in memoria o salvare una specifica voce[7]. Le sostituzioni sono andate tutte a buon fine e l'occasione mi ha offerto la possibilità di affinare il file settings.xml perché si erano manifestate un paio di eccezioni (difficilissime da prevedere senza una reale manovra "sul campo", cioè in NS-0, di AWB). L'incidenza dei falsi positivi è stata lievemente minore di quella che mi sarei atteso e ciò ha influito positivamente sul regolare svolgimento del lavoro. Preciso che non sono mai uscito da AWB per eseguire correzioni "extra" a mano al di fuori del counter di AWB per cui il numero di effettivi interventi è realmente quello verso il fondo della lista archiviata.
Gli errori
[modifica | modifica wikitesto]«Prima di scrivere, pensa; prima di pensare, leggi»
Dove si trovano
[modifica | modifica wikitesto]Una certo quantitativo di errori è presente nelle pagine di Wikipedia in funzione di alcuni fattori:
- è in numero alto dove il numero di parole contenute è elevato e contemporaneamente è basso il numero di modifiche che le pagine hanno subito nel corso del tempo a partire dalla loro creazione
- è in numero alto dove è basso il numero delle utenze singole che vi hanno lavorato e con lunghi intervalli di tempo fra le singole modifiche
- è in numero alto dove scarseggia il controllo (patrolling) contro i vandalismi o le modifiche errate
- è in numero più alto dove è minore l'aggiornamento delle pagine e in quelle trascurate per qualsivoglia motivazione[8].
Può formarsi una interdipendenza fra il primo punto e quelli successivi perché una pagina con molte parole e pochi aggiornamenti eseguiti da pochi singoli utenti e a lunghi intervalli di tempo presenta maggiori probabilità di vari errori (e non solo di tipo ortografico) di un'altra attentamente seguita, costantemente aggiornata, modificata e tenuta sotto un buon controllo da vari utenti.
Ne consegue che, in prima approssimazione, sono le pagine delle voci (nonché le relative pagine di discussione) quelle in cui avrò maggior occasione di riscontrare un interessante numero di errori: senza contare che attualmente (aprile 2012) l'enciclopedia conta circa 910 000 voci.
Ricordo che una parte consistente di errori deve obbligatoriamente essere registrata anche nel file settings.xml di AWB perché possano essere "scoperti"[9].
Lo status di errore
[modifica | modifica wikitesto]Perché taluni presunti errori acquisiscano lo status di "autentici errori" occorre una discussione seguita da un consenso della comunità wikipediana. Fin qui nihil sub sole novum. Il problema è che i dizionari e le grammatiche e la stessa Accademia della Crusca ai quali volgiamo l'attenzione, non sono entità normative il cui dettato abbia valore legale e nemmeno, più semplicemente, fonti normative sempre pacificamente accettate dagli studiosi. Sto pensando a una analogia con le norme tecnico scientifiche fissate dal SI e che sono quotidianamente disattese talora anche in contesti educativi (libri di testo e dispense) o informativi (quotidiani, stampa periodica "generalista" o specializzata) o economici (fatture commerciali di enti erogatori di servizi) nonostante i vari Stati contraenti ne abbiano sancito in modo inequivocabile il suo uso (anche al di fuori dall'ambito tecnico-scientifico) e il suo abuso con tanto di sanzioni.
Quindi, sotto questo aspetto, la soluzione che da i suddetti testimoni "cartacei o elettronici" potrebbe provenirci si limita ad essere, più modestamente, un suggerimento da analizzare e discutere fra noi utenti. È un fatto certo che i grammatici e i compilatori di dizionari sovente non spiegano quale variante grafica sia da preferirsi e la Crusca si limita ad analizzare, giustificare e spiegare quale sia la ragion d'essere di una variante nel corso del tempo ma senza prendere una netta posizione al riguardo[10]. Le regole grammaticali non sono ferree: dovrebbe essere un fatto di indubitabilità storica, che, per citarne uno fra i tanti, non vi sia un accordo unanime fra gli studiosi a riguardo della D eufonica[11] e con variegati pareri anche su Wikipedia[12]. Così il filosofo, scrittore e traduttore Ugo Dèttore in tutti i suoi scritti usava a esempio al posto del più comune ad esempio o del più classico "per esempio". È verosimile che il suo gusto personale o un suo particolare modo d'intendere l'eufonia (ipotizzo che volesse scansare un accostamento fonico ad e... a Ade perché per alcuni di noi si palesa di potenziale malaugurio), prevalessero su regole cristallizzate.
Se a ciò aggiungiamo che non è chiaro se una determinata parola (o una sua variante grafica) che è entrata in uno più dizionari di lingua sia di uso comune e comprensibile per tutti o per la stragrande parte degli italoparlanti ce n'è a sufficienza per aprire una discussione su come ci si debba regolare ortograficamente nella stesura delle voci.
Il consenso
[modifica | modifica wikitesto]Può capitare che, durante lo svolgersi delle discussioni, le parti contendenti adducano razionali motivazioni che potrebbero equamente essere candidate come regola (policy) da seguire. Dal momento che la regola è, o dovrebbe essere, per quanto possibile una sola, breve e chiara, in tali situazioni di equità nei giudizi espressi è accaduto con una certa frequenza che le risoluzioni finali si fondassero su questi punti:
- Non vietare in assoluto una certa grafia in quanto essa può essere una legittima e libera scelta stilistica del singolo autore
- Consigliare in generale di preferire la forma più comune della parola (o della locuzione), ovvero quella più usata perché maggiormente comprensibile ai lettori / alle lettrici dell'enciclopedia
- Fare un uso omogeneo delle varianti ortografiche all'interno della singola voce
- Dare la preferenza a quella forma ortografica che al momento è la più utilizzata all'interno di una o più categorie.
Il fatto che si giunga a concludere di non vietare una certa forma grafica (o un certo modo di dire o una certa locuzione) non dà adito a nessuno di obiettare che non si debba "correggere" se la "correzione" mira a un miglioramento della leggibilità, della spigliatezza, della velocità di apprendimento del contenuto. Per esempio: se in una voce è ripetuta più volte una stessa parola, una stessa frase, perché non cercare, se vi sono, parole sinonime o modi di dire alternativi e altrettanto validi?[13]
Per ciò che può valere la mia pratica personale con AWB posso dire che non lo faccio partire per eseguire solo questo semplice lavoro (motivi: non si devono sovraccaricare i server per una serie di piccole modifiche ma anche non sciupare il proprio tempo) bensì con altri interventi più impegnativi e urgenti. Per esempio l'ho istruito a cercare i vari "rilascia/ano/ato/i/o..." predisponendo una generica sostituzione con "pubblica/ano/ato/i/o... più il normale lavoro di routine. Chiaramente la sostituzione proposta non è sempre valida: l'importante è che AWB intercetti l'abuso linguistico lasciandomi libertà e discrezionalità per cercare un sinonimo più adeguato (se esiste) e inserendolo a mano nell'edit box. Questa possibilità aggiuntiva sarebbe già sufficiente a spiegare il suo sotto-nome: The semi-automated wiki editor...
Alcuni paradossi. La "Regolaccia" delle tre generazioni
[modifica | modifica wikitesto]La fretta di correggere
[modifica | modifica wikitesto]Nel correggere gli errori di ortografia e i refusi dattilografici non ci vuole fretta!
Il tempo di attesa fra un salvataggio e il successivo può essere impiegato per un'occhiata aggiuntiva al periodo precedente o a quello seguente per rendersi conto che, a fianco degli errori attesi, ce ne potrebbero essere altri. Alcuni elementi da verificare possono essere così riepilogati: la sintassi, la scorrevolezza dei periodi, se le frasi posseggano un senso logico con relativa attenzione agli eventuali vandalismi dissimulati (occorre una certa esperienza e attenzione per scovarli) e così via. Se si pone una totale ed esclusiva attenzione all'errore "scoperto" da AWB potrebbe capitare (è accaduto e ancora accadrà) di correggere invano un errore ortografico all'interno di un periodo che in primis richiedeva un controllo più approfondito. Potrebbero però esservi utenti che valutano il minuto di attesa ai fini di un apprendimento "sicuro e senza danni" all'uso del software.
Per conseguire i risultati di cui al paragrafo precedente AWB può funzionare anche come browser con il quale è possibile ispezionare l'intero testo portandosi con l'occhio sulle e al di là delle fasce di testo colorate. Detto in termini ancor più esemplificativi: AWB è un software che incorpora un browser per modificare i testi di Wikipedia (esempio).
La velocità e il rendimento
[modifica | modifica wikitesto]Riporto, modificando un po' le parole ma non il senso, due distinti commenti di altrettante utenze a proposito degli attuali limiti di AWB (aprile 2012) ai quali devono soggiacere le utenze che non operano come bot ufficiali.
«(...) con AWB a 1 edit al minuto, ne faccio di più a mano (...)»
«(...) attendere che passi un minuto è un po' frustrante (...)»
Per la frustrazione che si potrebbe provare, ho già specificato le ragioni per le quali la fretta non paga. Non entro poi nel merito se sia più frustrante attendere un minuto fra una modifica e l'altra, oppure sentirsi dire alla fine del lavoro che si son fatte una serie di modifiche da annullare per questo o per quel motivo...
Più interessante è l'obiezione dell'Anonimo 1 in quanto reitera un luogo comune, un tranello. La velocità slegata da un parametro non dice nulla. La velocità di intervento la si misura sia come quantità di correzioni all'interno di una singola voce eseguite tramite un automatismo rapportate a quella che un utente di media esperienza potrebbe eseguire tramite il suo browser nel medesimo tempo impiegato dall'automatismo (A) e sia come quantità intercorrente fra le correzioni massime presumibili di un utente di media esperienza nell'unità di tempo (di solito si assume come riferimento il minuto oppure l'ora) e quelle di un bot (2). Nelle due illustrazioni che ho preso a mo' di esempio si palesa che AWB, a differenza di un utente umano, può svolgere correzioni di ragguardevole imponenza. Soprattutto la figura (A) mostra e dimostra che in una manciata di minuti (3-4 al massimo) si possono eseguire all'interno di 2-3 voci ben oltre 1 000 correzioni, senza infrangere la policy!
Occorre inoltre prudenza perché un massiccio numero di piccole modifiche a brevi intervalli di tempo, anche se eseguite a mano, non è generalmente ben visto dalla comunità di Wikipedia in particolar modo di chi si occupa di patrolling (e dal buon senso). Faccio un esempio pratico. Se devo cercare tutte le occorrenze di perchè e poi di poichè, poi di benchè, poi di (...) è inutile e dispendioso in termini di tempo (mio e altrui) e risorse di rete che le faccia e le rifaccia per ogni parola; meglio una regex ad hoc da implementare in AWB. E se proprio non posso o non voglio usare AWB, mi vengono in aiuto i correttori ortografici di cui i maggiori browser sono forniti o installabili come plugin e poi inserire nel campo della ricerca hè, oltre che osservare le sottolineature rosse.
Accuratezza, aritmomania, errori, fretta
[modifica | modifica wikitesto]Si tratta di inquadrare al più presto che cosa abbia a che spartire l'aritmomania nel presente contesto. Mi viene in aiuto un saggio redatto dai colleghi di lingua inglese leggibile qui.
In linea generale potrebbe essere utile controllare il numero dei propri contributi a scadenze temporali ben definite (per es. a inizio e fine sessione) specie se si è versati nella statistica. Per esempio si può conoscere tramite una semplice differenza aritmetica quanti edit ho compiuto correggendo una parola errata e vedere come tale errore si ripresenta in termini quantitativi nel corso del tempo senza bisogno di fare un esagerato numero di note al margine in questa pagina. Un po' di inventiva personale non guasta, anzi.
La situazione cambia e non di poco quando il conteggio degli edit è fine a sé stesso; ovvero quando è un'azione circoscritta in un esclusivo ammirare un contatore che gira, gira e gira... senza che chi l'osserva si renda conto che, a monte, ci sta un progetto a cui contribuisce e che per sua intrinseca natura richiederà un costante aggiornamento del quale non si vede un termine!
Questa situazione non solo può minare la salute del singolo utente ma potrebbe anche arrecare danni al funzionamento dell'enciclopedia. Cosa capita quando un notevole quantitativo di utenti fanno un gran numero di modifiche di piccola entità a brevi intervalli di tempo? Sovraccaricano inutilmente i server con uno sperpero di risorse! Non è cosa da sottovalutare tant'è che esiste un apposito template che i patroller notificano nelle pagine di discussioni degli utenti: {{anteprima}} vale a dire un avviso di presunto abuso di salvataggi. Tuttavia queste sequenze di "salvataggi impulsivi" non vanno confuse con il vandalismo; è però bene che questi utenti si adeguino a usare l'anteprima.
(proseguirà...)
La torre di Babele e le tre generazioni
[modifica | modifica wikitesto]«Non voglio più saperne; il famoso cogito mi fa andare in bestia. (...). Si spiega ciò che si capisce pochissimo per mezzo di parole che non si capiscono affatto!»
Le Odi barbare di Carducci e il Duca d'Atene di Tommaseo furono alcuni fra i tentativi che i letterati dell'Ottocento tentarono per ridare lustro alla poesia e alla prosa rifacendosi a modelli stilistici del passato. Il contenuto di queste opere è tutt'oggi (2012) comprensibile senza bisogno di particolari spiegazioni a un lettore di media preparazione scolastica. Furono tentativi che, però, fallirono perché la metrica e il lessico del tempo erano diretti ad altri modelli e innovazioni. Inoltre nel passaggio dal Settecento all'Ottocento si assistette in Europa alla nascita di nuove professioni e studi e, sopra di tutto, al progressivo allontanamento (specializzazione) fra le discipline umanistiche e quelle scientifiche (si pensi all'affermarsi del Positivismo) con la impellente necessità di "inventare" o "adattare" un lessico preesistente in altre lingue per le sopravvenute necessità.
Verso la fine del XX secolo una pubblicazione periodica italiana ad amplissima diffusione, propagandava la commercializzazione a dispense della Divina commedia precisando che era stata tradotta (sic) in italiano; alcuni anni dopo alcuni insegnanti delle scuole medie osservavano che il Verga non poteva essere proposto in lettura agli studenti di lingua italiana dell'Alto Adige perché essi non capivano il senso delle frasi, il quale doveva essere costantemente tradotto (sic) in classe dai docenti.
Preferisco esentarmi dai commenti perché io e tu che leggi questa righe possiamo trarne alcuni liberi spunti di riflessione riferiti al contesto wikipediano. Un contesto quanto mai variegato e mutevole per i liberi apporti di conoscenza che utenti volontari sparsi per il mondo apportano costantemente.
Più che risposte preferisco propormi alcune situazioni tratte dalla quotidianità.
È il contenuto di Wikipedia comprensibile a tutti? Se qualcuno desidera espandere il proprio orizzonte cognitivo su determinati argomenti nei quali è versato ma non si è tenuto aggiornato nel corso di alcuni anni, vi riuscirà leggendo i "nostri" articoli? Se il quidam assumesse l'essenza di Tre distinte generazioni quale sarà il grado di fruibilità dei contenuti di Wikipedia? Il contenuto di Wikipedia risponde alla domanda culturale delle Tre generazioni? Il contenuto di Wikipedia è curato, è oggetto di attenzione alla pari del contenitore nell'equo rispetto delle Tre generazioni?[14]. La lingua impiegata nelle voci nella sua complessiva morfologia è senza dubbio adeguata per essere compresa senza o minime difficoltà dalle Tre generazioni?
Alle scuole elementari avevo un maestro che in previsione di sorbirci i nostri temi scalcagnati d'italiano aveva l'abitudine di ripeterci: «Quando scrivete fate finta che io non conosca affatto l'argomento e non entrate d'un subito in medias res» Ripeteva che suo padre (anch'egli maestro) gli aveva insegnato il latinorum «a forza di calci nel sedere (sic).» e pure noi ci dovevamo avvezzare. Alle locuzioni latine. Senza bisogno ogni volta di "reinventare la ruota" è auspicabile (anzi necessario) che le composizioni, ivi compresa una enciclopedia, siano presentate con un vestito che le renda degne per lo meno sotto l'aspetto della comprensibilità delle parole-concetti esposte.
Ancora. Mi interrogo se sia una scelta oculata quella di dare per scontato che sia sempre un bene che a ogni battito di ciglia il lettore / la lettrice debba distrarre la lettura dell'articolo di proprio interesse da un link che tenta di spiegare un termine, una locuzione, un modo di dire? Come si comporterà, cosa penserà se egli/ella non trovando un link esplicativo di un termine non italiano consulterà un dizionario che -massima sfortuna- non elenca proprio quell'eccezione o pur elencandola non riesce a dare un senso compiuto alla frase che leggeva[15]? Vero è che ogni lettore/lettrice può, è liberissimo di approfondire o di ignorare ciò che nel testo reputa più utile o inutile ai propri interessi; ma in tante voci si possono riscontrare link al limite del ridicolo e non solo per la loro ripetitività all'interno del medesimo testo[16]
Mi domando se le scelte tecniche operate a monte del Progetto tengano conto che vi sono persone, vi sono nazioni povere, molto povere che utilizzano sistemi operativi e browser vetusti e che non gliene importa un fico secco se "Zilla" o "Plorer" sia o no il migliore o peggiore browser in circolazione.
Mi domando se il software di Wikipedia sia da noi usato dando la massima priorità all'igiene dell'occhio. Perché, a quanto pare, i testi li si leggono con gli occhi i quali, a differenza di un PC, non possono essere regalati, acquistati o sostituiti una volta deteriorati.
Mi domando se stiamo fornendo (o siamo sulla buona strada per farlo) la possibilità anche ai ciechi e ai sordi di fruire dell'enciclopedia: qual è, a tal proposito, lo stato di interesse e l'avanzamento dei lavori della Wikipedia parlata?
Errare humanum est
[modifica | modifica wikitesto]Premesso che gli errori ortografici non sono vandalismi (esclusi quei casi dove l'errore è intenzionale in quanto utilizzato con la palese intenzione di danneggiare l'enciclopedia); è un obbligo che chi corregge mantenga un rapporto di cordialità e indulgenza nei confronti di chi ha sbagliato l'ortografia e la grammatica. Mai far pesare l'errore per mezzo di parole esplicite ma nemmeno presentandoli con più o meno velati sarcasmi alludenti all'autore e alle sue capacità.
Resta il fatto che alcuni di noi potrebbero avere sviluppata una personale reazione repulsiva alla presenza di un testo con errori d'ortografia o grammaticali: in ogni caso non si deve mai toccare la buona fede di chi li ha commessi. Sarà invece più saggio che l'utente che vuol correggere indirizzi i propri sforzi su come l'errore potrebbe essere concretamente contrastato con il minor impiego di tempo e fatica.
Grazie al controllo discreto che eseguo sugli errori ho per esempio notato delle peculiarità fra le quali una certa ciclicità nel loro ripresentarsi dovuta a varie cause -non tutte chiarite- che qui è fuori luogo enunciare. Grazie però a tali periodiche ricorrenze mi è possibile programmare un certo ordine di intervento prioritario in rapporto alla loro maggiore o minore diffusione nelle pagine di Wikipedia. Non nego che in tutto ciò possa entravi una personale (e forse innata) predisposizione a studiare le cause piuttosto che a deriderle (fatti salvi gli sporadicissimi casi in cui -del tutto involontariamente- si verifichino involontari e ameni giochi di parole che muovono l'ilarità generale compreso chi ha errato).
Il testo sotto riportato è parte del codice di condotta di chi lavora con un bot. L'originale è qui;
L'essenza resta intatta anche per quanti correggono gli errori "a mano".
Il colore e il grassetto sono miei.
«Il lavoro del manovratore è difficile e spesso ingrato. Il fatto di poter arrecare grandi danni in breve tempo porta la maggior parte degli utenti ad avere un atteggiamento piuttosto severo nei confronti dei manovratori. Per questo motivo è fondamentale che chi gestisce un bot abbia una particolare cura nel gestire le comunicazioni correlate a questa attività.
Essere in grado di rispondere cordialmente, rapidamente e in maniera pertinente è una condizione importante per poter gestire un bot.
Sempre al fine di migliorare l'aspetto comunicativo è importante utilizzare oggetti delle modifiche chiari ed esplicativi.»
Da questi elementi è sufficientemente chiaro che la correzione degli errori ortografici non può essere improvvisata ma attentamente valutata in primis dalla singola utenza per vedere quando è possibile attuare una correzione totalmente automatizzata "cieca" e quando invece occorre un controllo visivo voce per voce anzi, periodo per periodo. Per ottenere ciò occorre avere una motivazione personale e molto tempo, sia per scovare gli errori più noti e sia quelli meno evidenti o oggetto di contestazioni.
(proseguirà...)
Gli errori secondo AWB
[modifica | modifica wikitesto]Se opportunamente istruito AWB gestisce e ripara (ovvero: sostituisce) quasi tutti i tipi di errori di ortografia, di refusi e dattilografici tipici della scrittura con tastiera, ma anche i regionalismi o parole dialettali in contesti che non li prevedono affatto. Nel contempo AWB esamina anche gli errori di formattazione per esempio da <i> </i> a '' '' comprese le eccedenze o la scarsità di spaziatura interlinea ("ritorni di carrello"). Su quest'ultimo caso specificherò in una sezione a parte se e come convenga operare in presenza di correzioni di minore entità (minor edits).
Il software AWB è anche in grado di svolgere altri compiti qui non trattati ma comunque descritti nel manuale di istruzioni.
«AutoWikiBrowser (AWB) comes with ABSOLUTELY NO WARRANTY. AWB is constantly in development, and there may be bugs in the software. YOU are responsible for what you do with this tool. Use it at your own risk.»
Come AWB corregge gli errori
[modifica | modifica wikitesto]La conduzione più veloce eseguita in modalità automatica (proibita dal regolamento a chi non ha il flag di bot)[17] oppure eseguita lentamente in modalità semiautomatica, senza ispezionare l'edit box, sono quelle che producono il maggior numero di false correzioni e quindi le più rischiose sia per il Progetto e sia per la reputazione del manovratore.
L'operatore che ispeziona l'edit box prima di salvare il contenuto, riduce di molto la probabilità di incorrere in un errore[18]
Partendo dal dato di fatto che AWB permette sempre di ispezionare il contenuto e di aprire il browser nella voce prima del salvataggio, può essere più razionale sfruttare questa possibilità, piuttosto che svolgere una serie di correzioni come utente-Bot e poi controllarle come utente-non-Bot.
Vi è però da precisare che lanciando il proprio browser tramite AWB[19] si potrebbe entrare nella pagina di Wikipedia come utente anonimo (se il browser è configurato perché all'uscita cancelli i dati di accesso al proprio account) ovvero con l'account di utente "normale" ovvero di utente "bot". L'attuale policy in vigore su it.wikipedia.org non permette che l'utente-Bot esegua correzioni manualmente e di queste situazioni occorrerà che chi lavora con AWB ne tenga debito conto e altrettanto dicasi per gli amministratori, i burocrati (ai quali è demandata la possibilità di applicare e rimuovere la funzione di Bot) e infine a quei botolatori che non sono edotti sulle funzionalità di AWB.
Il file settings.xml di AWB
[modifica | modifica wikitesto]Il file settings.xml contiene quelle impostazioni che servono al funzionamento del software su un progetto Wiki. A fianco di una struttura predefinita che permette un funzionamento di base, l'utente può inserire delle espressioni regolari che costituiscono il "dizionario interno" di AWB. Mi limito a un sunto delle possibilità che riguardano in modo specifico la ricerca degli errori nei testi.
La regex che segue, attinente alla formattazione in uso su Wikipedia, permette di trovare all'interno di una pagina tutte le occorrenze di </br> <br\> <br/> e di sostituirle in blocco con: <br />
<IRule xsi:type="Rule"> <enabled_>false</enabled_> <Children /> <Name>Give <br /> tags proper XHTML format.</Name> <ruletype_>OnWholePage</ruletype_> <replace_></?br\s*/?></replace_> <with_><br /></with_> <ifContains_ /> <ifNotContains_ /> <regex_>true</regex_> <ifIsRegex_>false</ifIsRegex_> <numoftimes_>1</numoftimes_> <ifRegexOptions_>None</ifRegexOptions_> <regexOptions_>IgnoreCase</regexOptions_> </IRule> <IRule xsi:type="Rule"> <enabled_>false</enabled_> <Children />
Esiste la possibilità di creare regex più complesse facenti uso di strutture annidate. Ma, al tempo stesso, è possibile scrivere regole strutturalmente più semplici e veloci (per lo meno dal punto di vista dell'operatore) ma che comunque richiedono attenzione per non provocare falsi positivi. Quella che segue cerca tutte le occorrenze di milano sostituendole con Milano
<Replacement> <Find>\ milano</Find> <Replace> Milano</Replace> <Comment /> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>false</BeforeOrAfter> <RegularExpressionOptions>IgnoreCase</RegularExpressionOptions> </Replacement>
I falsi positivi si possono sperimentare se, per esempio nella parte
<Find>\ milano</Find> <Replace> Milano</Replace>
si elimina lo spazio vuoto
<Find>\milano</Find> <Replace>Milano</Replace>
la regola cercherà non solo il singolo milano ma anche tutte le parole contenenti ...milano.... Per cui milano e assimilano, Assimilano verranno sostituite da Milano e da assiMilano, AssiMilano.
Quando il file settings.xml corregge le correzioni
[modifica | modifica wikitesto]Potrebbero presentarsi situazioni nelle quali AWB porge una errata correzione nonostante l'operatore ritenga di aver posto la massima diligenza nel compilare i Find and replace.
- Mi capitò in più occasioni una serie di situazioni nelle quali il wikilink di s.l.m. (sul livello del mare) e varianti grafiche, anziché [[s.l.m]] veniva scritto in alcuni casi: [[[[s.l.m.]]]], cioè con ben quattro parentesi quadre al posto delle canoniche due. Il fatto mi apparì curioso in quanto non mi ritenevo in grado di replicare l'errore tramite un test a parte. Si esamini l'attuale struttura (alla data del 11 aprile 2012):
...... <Replacement> <Find>slm</Find> <Replace>s.l.m.</Replace> <Comment /> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>false</BeforeOrAfter> <RegularExpressionOptions>None</RegularExpressionOptions> </Replacement> <Replacement> <Find>s\.l\.m\.</Find> <Replace>s.l.m.</Replace> <Comment>After fixes!!</Comment> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>true</BeforeOrAfter> <RegularExpressionOptions>None</RegularExpressionOptions> </Replacement> <Replacement> <Find>s\.\ l\.\ m\.</Find> <Replace>s.l.m</Replace> <Comment /> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>false</BeforeOrAfter> <RegularExpressionOptions>None</RegularExpressionOptions> </Replacement> ......
Dovetti controllare il contenuto della voce; riscontrato che s.l.m prendeva effettivamente più varianti grafiche all'interno della voce a causa dell'arbitrio dei collaboratori, dovetti stabilire un ordine di intervento, cioè una condizione supplementare alla regola, questa:
...... <Replacement> <Find>s\.l\.m\.</Find> <Replace>s.l.m.</Replace> <Comment>After fixes!!</Comment> *mio commento* <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>true</BeforeOrAfter> *condizione necessaria (true)* ......
in pratica la regola sopra riportata dev'essere applicata da AWB dopo le altre se si vuole che, in tutti i casi, si abbia la seguente resa grafica finale: s.l.m e non [[s.l.m.]].
- Ecco un'altra sostituzione la quale ha richiesto che tutti i casi di sostituzione "del Sc --> dello Sc" abbiano attivata (true) la condizione <BeforeOrAfter>true</BeforeOrAfter> onde evitare questa falsa correzione "--> dello Scoialismo".
- In questo altro caso è stato necessario applicare la correzione .d -> . D dopo la seguente correzione: della c.d. -> della cosiddetta altrimenti si sarebbe erroneamente corretto: della c. D.. Si consulti il Manuale di stile nel punto dove invita a ridurre al meno possibile le abbreviazioni al fine di una migliore leggibilità dei testi.
- Può essere interessante osservare questa regex estratta dalla pagina dei Typos:
<Typo word="Di sé" find="\b(D|d)i se\b" replace="$1i sé" />
Quando trova: se' produce: sé' presumibilmente perché alcuni utenti utilizzano una tastiera non italiana.
Per rimediare ho inserito la correzione sé' -> sé da applicare subito dopo quella presente nella pagina dei typos cioè vale a dire in un'unica passata (<BeforeOrAfter>true</BeforeOrAfter>):
...... <Replacement> <Find>\ sé'</Find> <Replace> sé</Replace> <Comment /> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>true</BeforeOrAfter> <RegularExpressionOptions>IgnoreCase</RegularExpressionOptions> </Replacement> ......
Questo è il risultato. (Vi è un apostrofo fuori luogo e che non c'entra: era necessario lasciarlo così-momentaneamente- per mostrare l'intero contenuto del campo oggetto)
Di tanto in tanto qualche utente inserisce qualcosa come:
una altro
un accostamento errato oltre che brutto a leggersi e da pronunziare. Per contro AWB l'ho istruito in modo che inserisca un apostrofo quando l'articolo indeterminato "una" precede una parola iniziante per "a". Nel caso specifico si sarebbe prodotta la falsa correzione seguente:
una altro —> un'altro
Anche in questo caso occorre scrivere nel file settings.xml una correzione suplettiva per evitare di far passare due volte AWB sulla voce:
<Replacement> <Find>un'altro</Find> <Replace>un altro</Replace> <Comment /> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>true</BeforeOrAfter> <RegularExpressionOptions>None</RegularExpressionOptions> </Replacement>
Come di consueto si deve stabilire l'ordine di intervento che in questo caso è After, cioè Dopo avere messo l'apostrofo una a —> un'a.
Ciò che è importante ricordare da queste situazioni è che una prova condotta nelle sotto pagine dell'utente non potrà mai sostituire un'esperienza reale "sul campo" cioè in NS:0. Attenzione! Non è detto che gli inconvenienti si manifestino "alla prima uscita", a volte occorrono giorni, a volte settimane per rendersi conto che qualcosa non va nel dizionario. Sotto questo aspetto la conduzione semiautomatica di AWB (cioè con ispezione umana prima del salvataggio) è raccomandabile anche ai botolatori con flag.
Le correzioni di minore entità con AWB
[modifica | modifica wikitesto]AWB è un software che "dialoga" con un server dedicato con un carico di esercizio, a volte intenso, il quale è bene che sia finalizzato a modifiche di indubbia utilità e urgenza. Viene pertanto logico domandarmi se le piccole modifiche (aggiustamenti di spaziatura fra le singole lettere o le righe, uniformazione di tag per compatibilità XHTML, rimozione di tag deprecati perché obsoleti o in contrasto con le norme di accessibilità e così via) abbiano le carte in regola per essere elaborate senza tema di essere additato come utente "sprecone di risorse"[20]. Dico che una risposta la potrei dare solo tramite un ragionamento ad inversum. Provo idealmente (voglio dire che non lo faccio materialmente ma solo ipoteticamente) a scartare sempre le predette correzioni di "minor conto" e come me tutti coloro che fanno uso di automatismi. Trascorso un congruo periodo di tempo -difficile da indicare ma senza dubbio reale- i testi in NS:0 mostreranno un incremento di più o meno piccoli "difetti di varia formattazione" al punto che ci potrebbero essere le condizioni per parlare di un intervento tramite bot. Dunque come potrei comportarmi? La soluzione che mi pare più ragionevole è quella di evitare i due precedenti "scenari" tramite una "diluizione", ovvero un inframmezzamento di consistenti correzioni con altre di minore entità specie se queste ultime sono di una certa rilevanza numerica nella pagina che sto per salvare.
AWB e il debugging
[modifica | modifica wikitesto]Questa nota interessa per lo più gli operatori. Quando si commette un errore nello scrivere una regex nella pagina dei Typos, AWB lo segnala tempestivamente. L'esempio si riferisce a un caso reale: leggi i particolari.
Il campo oggetto scritto da AWB
[modifica | modifica wikitesto]L'operatore / l'operatrice può modificare, entro certi limiti, il contenuto del campo oggetto per adeguarlo alla lingua del Progetto oppure per indicare esattamente il compito che sta svolgendo.
Da tale contenuto si possono evincere alcune informazioni. Non mi risulta che la delucidazione che segue sia riscontrabile nel manuale tecnico di AWB. L'ho ricavata da mie osservazioni.
- Il campo oggetto è totalmente vuoto
- chi manovra ha il flag di bot, ha volontariamente abilitato l'opzione Suppress "using AWB" in edit summary e ha apportato modifiche a mano nell'edit box.
- Il campo oggetto non indica in modo completo l'intervento svolto
- Si è superato il numero massimo ammissibile di caratteri
- Sono presenti una o più freccette precedute e seguite da spazi vuoti ovvero da uno o più numeri, come in (replaced: → (61), → (20), → (5) using AWB): il numero fra parentesi indica quante volte è stata applicata la sostituzione (se per una sola volta è omesso), mentre la presenza di spazio "vuoto" a sinistra della freccetta nel campo indica una eliminazione di due (o più di due) spazi in eccesso fra i caratteri. Se lo spazio vuoto standard è indicato da allora la modifica sarà visibile in LiveRc ma non negli ultimi contributi dell'utente (e nemmeno nella cronologia della pagina).
- Nel campo oggetto si legge solo la frase: using AWB (usando AWB)
- chi manovra ha disabilitato l'opzione Add replacements to the edit summary oppure ha scritto a mano nell'edit box ovvero tutt'e due i casi.
- AWB ha letto e applicato unicamente le regex accessibili dalla scheda Options, Advanced settings
- AWB ha applicato una o più regole di sola formattazione mentre il manovratore non ha compilato il campo oggetto
- Nel campo oggetto si legge replaced: abbile → abile, (sostituzione)
- AWB ha applicato la regola inserita nel file settings.xml
- Nel campo oggetto si legge typos fixed: inghilterra → Inghilterra, (correzioni tipografiche)
- AWB ha applicato la regola inserita nella pagina dei Typos
- Nel campo oggetto si legge removed: stocazz, removed: magnifico using AWB (rimozione)
- AWB ha applicato la regola che prescrive la rimozione di una o più parole inadeguate, indicate dall'operatore nel file settings.xml.
A seconda di come è configurato, AWB può scrivere più combinazioni nel campo oggetto fino al numero massimo di caratteri permesso.
I numeri racchiusi fra parentesi tonde, nell'esempio l' → l' (17) e un' → un' (2), indicano quante volte è stata applicata la sostituzione.
Eccezioni da sapere
[modifica | modifica wikitesto]Attenzione: a volte e in modo impredicibile, AWB applica alcune eccezioni all'elenco dei campi oggetto più sopra elencati. Per esempio in questa modifica esso attingeva al mio dizionario interno solo per quanto riguarda [madonna->Madonna] e perciò si sarebbe dovuto leggere: replaced: madonna → Madonna,....
Altre volte aggiunge una parte del testo della voce. Si tratta di trovare un accordo fra chi fa patrolling intensivo (e potrebbe essere disturbato visivamente da simili "corposi" campi oggetto) e chi deve o vuole indicare puntualmente ad altri cosa sta facendo AWB.
A seconda di come è configurato il file settings.xml si potrebbero avere dei campi oggetto che non corrispondono —in tutto o in parte— alla reale operazione svolta: (Typo fixing, replaced: , → ,, typos fixed: t → t using AWB). Si potrebbe pensare che AWB abbia sostituito , con ,, il che non è vero (oltre che errato). Nel mio file settings.xml è presente una regola "obbligata", perché se è vero che precedenti regole a monte aggiustano lo spazio fra la virgola e una lettera, per esempio:
chitarre ,mandolini ,arpe... sostituendo con:
chitarre, mandolini, arpe...
alcuni utenti inseriscono una complicazione così esprimibile:
chitarre, ,mandolini ,arpe...
la quale viene corretta parzialmente così:
chitarre,, mandolini, arpe...
e quindi occorre una correzione suplettiva all'occorrenza:
<Replacement> <Find>,,</Find> <Replace>,</Replace> <Comment /> <IsRegex>false</IsRegex> <Enabled>true</Enabled> <Minor>false</Minor> <BeforeOrAfter>true</BeforeOrAfter> <RegularExpressionOptions>IgnoreCase</RegularExpressionOptions> </Replacement>
E comunque non si tratta ancora di ciò! Verosimilmente AWB scrive nel campo oggetto alcune operazioni eseguite al suo interno ma che non sempre corrispondono alla reale ed effettiva sostituzione applicata e quindi il predetto campo oggetto non è sempre affidabile (per chi deve controllare "al volo", cioè senza avvalersi della differenza di versioni).
Impostazioni predefinite del campo oggetto
[modifica | modifica wikitesto]Quelle che seguono sono le impostazioni già presenti in AWB per il campo oggetto. Alcuni link sono rossi perché puntano a pagine di servizio e template presenti solo nella versione inglese di Wikipedia.
<SelectedSummary> </SelectedSummary> <Summaries> <string>clean up</string> <string>re-categorisation per CFD</string> <string>clean up and re-categorisation per CFD</string> <string>removing category per CFD</string> <string>subst:'ing</string> <string>stub sorting</string> <string>Typo fixing</string> <string>bad link repair</string> <string>Fixing links to disambiguation pages</string> <string>Unicodifying</string>
Si noti che la parte di codice:
<SelectedSummary> </SelectedSummary>
serve a ricordare ad AWB che, all'avvio, deve predisporre uno (1) spazio vuoto nel campo oggetto. È necessario inserire nel campo oggetto almeno uno spazio, altrimenti AWB si rifiuta di lavorare.
L'impostazione di uno spazio vuoto nel campo oggetto è a discrezione dell'utente.
Personalmente l'ho trovato utile per risparmiare spazio in caso di lunghi elenchi di sostituzioni ma è ovvio che, per esigenze di servizio, potrebbe essere preferibile caricare all'avvio un'altra scelta. Durante il lavoro è sempre possibile cambiare i campi oggetto (o aggiungerne di nuovi e salvarli) selezionandoli dal menù a tendina Summary:... nella scheda Start.
Difetti noti o presunti di AWB
[modifica | modifica wikitesto]Se non diversamente specificato mi riferisco alla versione 5.3.1.0
- Non riconosce il template bio e aggiunge un ulteriore grassetto[21].
- In taluni casi non riesce a "vedere" in modo unitario (nella lista generata la pagina di servizio era ripetuta 4 volte).
- AWB trascorso un certo numero di secondi di inattività viene disconnesso dal server: vengono mantenute memorizzate le credenziali di accesso (nome utente più password). Subito dopo il messaggio di avviso, inizia un conteggio alla rovescia per una nuova connessione. Quest'ultima può essere anticipata premendo su Start. Pare essere un'esigenza imposta dal servizio.
- AWB tenta ripetutamente e a intervalli incrementali di tempo di connettersi senza successo al suo server. Chiaramente non è un difetto vero e proprio bensì non è stata curata a sufficienza la leggibilità del messaggio di errore (504=Gateway Timeout) il che è chiaramente visibile e descritto all'interno dello screenshot.
- Su alcuni PC e/o in loro particolari configurazioni, quando in AWB è opportuno cambiare il Default Summary (alias: il "campo oggetto") nel bel mezzo del lavoro, potrebbe presentarsi una schermata opaca persistente per alcuni secondi simile a questa la quale "ingombra" tutta l'area del monitor. Allontanando il puntatore del mouse la schermata scompare ma quando si ritorna col puntatore del mouse in prossimità del box il fenomeno si ripresenta. Per rimediare si tenga premuto il tasto sinistro del mouse e attendere che la schermata a sfondo giallo scompaia. Dopo di ciò (mantenendo sempre premuto il tasto del mouse) si usino le freccette alto—basso della tastiera per spostarsi sopra o sotto il Default Summary selezionando quello più opportuno. Sembrerebbe una caratteristica correlata all'uso di versioni delle librerie .NET Framework >2.0 necessarie per il funzionamento di versioni di AWB >5.3.1.0.
Alcune particolarità di AWB
[modifica | modifica wikitesto]L'operatore alle prime esperienze è più ricettivo ai messaggi di AWB di uno già addestrato: inserisco in ordine sparso alcuni di essi in attesa di una migliore riorganizzazione...
- Come bloccare AWB (ogni abuso verrà perseguito a norme di policy...)
I bot fuori controllo, quelli non autorizzati, sono bloccati all'istante tramite una funzione in possesso degli amministratori e categorie superiori. Tuttavia per comunicare celermente qualcosa al manovratore di AWB ma senza che vi siano gli estremi di un blocco drastico imposto per motivi di sicurezza e salvaguardia del Progetto gli si può scrivere in talk, con questo risultato "lato operatore".
- Come sbloccare AWB (blocchi imputabili in prima approssimazione alla complessa formattazione di alcune pagine)
In alcuni casi AWB non risponde più all'operatore: si blocca per un tempo che potrebbe variare fra alcuni secondi e alcuni minuti. Ci sono due o tre possibilità e sta a chi conduce l'automatismo verificarne l'applicabilità caso per caso.
Soluzione bruta: se si usa Windows XP premere in sequenza i tasti CTRL ALT CANC selezionando Processi e dalla colonna Nome immagine, clic destro su AutoWikiBrowser.exe e poi Termina processo; rispondere Sì. Si perderanno tutti i dati di lavoro non precedentemente salvati.
Soluzione estrema: se è il computer a non rispondere più, premete il pulsante reset posizionato sul pannello del PC. Per la verità in oltre due anni di uso intensivo di AWB non mi è mai capitato di farlo, comunque è bene sapere che se si hanno altri programmi aperti si perderanno i relativi dati di lavoro.
Soluzione soffice: attendere con pazienza... e una volta che si è sbloccato, salvate subito le impostazioni di lavoro nell'eventualità di un (malaugurato) ripetersi dell'evento!
- Come salvare o recuperare il contenuto di Advanced settings
Prima di chiudere AWB occorre sincerarsi se le modifiche effettuate nel suo dizionario debbano essere salvate oppure scartate. Il comando Delete in Replace Special si applica istantaneamente e non è possibile recuperare il contenuto di ciò che si è modificato mantenendo AWB operativo. È possibile ripristinare il contenuto del file settings.xml come si trovava all'ultima apertura di AWB, ovvero al momento dell'ultimo salvataggio semplicemente chiudendo il programma senza salvare nulla.
- Come vengono trattati i conflitti di edizione?
In modo limpido con relativo avviso per l'operatore.
A onor del vero non è semplice ottenere uno screenshot esplicativo di tale situazione (in oltre due anni di uso molto intenso l'ho esperito non più di 3 o 4 volte in tutto). Affinché si manifesti un conflitto di edizione occorre che un altro utente esegua e salvi una modifica della pagina proprio un po' prima di AWB. Ecco un'immagine del 29-ago-2012. Premendo il tasto OK viene ricaricata la versione aggiornata dall'utente "contrastante" AWB: se l'operatore in precedenza aveva compiuto modifiche personalizzate al testo, esse dovranno essere reinserite (a mano).
Nota. Alla data attuale (ago 2012) AWB ignora (cioè "maschera") la presenza di {{WIP}} per cui l'operatore si ricordi di ciò se gli saranno mosse rimostranze. Se l'intervento di AWB è anche nell'incipit è bene che l'operatore si abitui a guardare in cima alla pagina (anche per evitare di inserire due volte lo stesso template, per esempio {{correggere}}.
- Come passare dal funzionamento bot a quello semiautomatico senza apparente instabilità del software (dalla versione 3.0 alla 3.4)
La soluzione migliore è fermare il bot, andare nella scheda Bots e togliere il segno di spunta ad Autosave. Se si desidera fare ripartire il bot dopo che esso ha raggiunto il valore numerico della casella Max edits potrebbe essere consigliato chiudere AWB e rilanciarlo. Se non si è ancora raggiunto il lavoro si può fermare il timer/contatore dalla linguetta Start e quindi Stop. Disabilitare l'Autosave e iniziare a lavorare in semiautomatico. Vedi l'immagine esplicativa (fusione di due screenshot). Rispettare la policy del Progetto.
- Come scavalcare il blocco alle modifiche causato dalla presenza del template in use (ma anche dalla presenza di un link "lungo" iniziante per esempio con https://it.wikipedia.org/una pagina) al posto di un wiki link nella v. 5.8.6.0 e v. 5.8.7.0
Il risultato non è garantito e men che mai documentato.
Non si prema subito il tasto OK proposto da AWB, bensì si apra la pagina che contiene il {{WIP|}} con il normale browser. Si attenda alcuni secondi e poi si torni ad AWB e finalmente si prema il tasto OK. Le modifiche, con AWB, dovrebbero essere ora possibili (risultato non garantito). Da usare con prudenza e consapevolezza di ciò che ci si appresta a modificare.
- Dopo avere rimosso manualmente il template di Work in progress che mi bloccava l'accesso alla pagina desiderata, AWB ripristinava automaticamente il template (V.5.9.0.0).
AWB e Windows XP/IE8
[modifica | modifica wikitesto]Aggiornamento del mese di ottobre 2017. Your Browser's Connection Security is Outdated, HTTPS Browser Recommendations, HTTPS/3DES Deprecation. AWB per lavorare si basa sulla presenza di IE, pertanto non funzionerà anche se sul computer è installata la versione recente consigliata da Wikimedia in sostituzione di IE8: Mozilla Firefox 52 ESR
AWB o browser del PC?
[modifica | modifica wikitesto]Il titolo esprime questo interrogativo: Per correggere gli errori (ortografici) è meglio usare AWB o il browser per la navigazione in internet? Si tratta di una situazione già anticipata nella sezione Errare umanum est ma tipica di chi non ha ancora acquisito una soddisfacente familiarità con le correzioni "sistematiche" (per correzioni "sistematiche" intendo tutte quelle azioni tese a eliminare con appropriato criterio dal database di Wikipedia tutte le occorrenze di un errore in NS-0, non solo da alcune pagine). Ecco allora che l'efficacia di un'azione non può prescindere da una valutazione preliminare del lavoro che si fonda e che si misura in ampia parte sull'esperienza dell'operatore/trice. Più di tante parole valga un esempio pratico. Se devo correggere una parola errata che il database mi indica essere presente in 30—40 pagine su di 1 000 000 e AWB invece mi costruisce una lista di 850 pagine nelle quali ritiene vi sia l'errore, forse è il caso di correggere tramite il browser per alleggerire il carico di lavoro (mio e dei server di Wikimedia). Se però quello specifico errore si ripresenta con una certa regolarità non è male inserirlo fra gli interventi da svolgersi periodicamente. Riguardo poi a quantificare questa "periodicità" non è semplice da stimare in quanto l'esperienza del singolo non è sufficiente e dev'essere raffrontata all'effettiva, reale (quindi non teorica) presenza di automatismi condotti da altri operatori/trici che incorporano "quella" specifica correzione. Quindi è bene tenersi tutti quanti in contatto riguardo anche alle sostituzioni di routine, quelle insomma che ripresentandosi a intervalli più o meno regolari richiedono una speciale attenzione.
Nei casi di errori che, presi singolarmente, superano un centinaio di pagine, è razionale avvalersi di un automatismo. Correggere a mano con la partecipazione di più utenze (ovvero singolarmente e a distanza di tempo fra una sessione e l'altra) può essere frustrante e affaticante e poco "redditizio" perché il database viene solitamente aggiornato dopo alcune ore e nel frattempo tale errore comparirà ancora fra i risultati delle ricerche anche se è stato eliminato.
AWB invece lavora caricando e scaricando automaticamente le pagine e l'operatore/trice non ha che da attendere e osservarne il funzionamento senza preoccuparsi se altri sono già passati fra quelle pagine in lista.
Domande frequenti: FAQ (Fully Anticipated Questions)
[modifica | modifica wikitesto]«Oggigiorno il silenzio è d'oro massiccio.
La parola latta arrugginita.»
Questa è una sezione che serve in modo precipuo a quanti mi scriveranno facendomi notare che io avrei corretto un termine o una parte del discorso o applicata una formattazione in modo errato o per lo meno discutibile.
Premesso che nessuno è perfetto e appurata una certa ripetitività di contenuto nelle note lasciatemi da leggere (e da rispondere) in questi anni, per evitar(mi) uno spreco di tempo per fornire le (più o meno solite) spiegazioni, le riassumo qui sotto in termini generici.
Domande generiche sul software AWB
[modifica | modifica wikitesto]- ...tramite AWB si può correggere la grammatica e la sintassi?
In teoria sì; in pratica è molto, molto difficile ottenere risultati soddisfacenti e applicabili su ampia scala.
- ...è vero che AWB è in grado di scoprire anche i vandalismi?
Sì ma a condizione che sia istruito per farlo. Come è facile comprendere il dizionario delle bestemmie, insulti, parolacce, improperi, ecc. deve essere mantenuto riservato e in mani di utenti di assoluta lealtà nei confronti del Progetto perché, rivelarne il contenuto, può vanificarne l'efficacia se cadesse in mani ostili al Progetto.
- ...ho creato alcune pagine: posso usare AWB per correggerle oppure ci potresti pensare tu?
Se sei un utente registrato lo puoi fare benissimo tu. Se proprio non ci riesci e hai paura di pasticciare... parliamone!
- ...si può cambiare la lingua usata per l'interfacciamento dall'inglese all'italiano?
No.
- ...ho un PC con Windows XP con Service Pack 3 e AWB non funziona!
Consulta questa sezione. Probabilmente avrai la necessità di aggiornare alla versione 2 questo componente di Windows. Poi controlla le impostazioni del firewall: se per ipotesi hai impedito l'esecuzione di AWB dovrai cercare la soluzione perché sia riclassificato fra i file sicuri. Tieni infine presente che AWB si appoggia sul browser Internet Explorer: se l'hai sradicato dal sistema operativo utilizzando uno speciale tool reperibile in Internet, allora AWB non potrà mai funzionare.
- ...AWB purtroppo mi avvisa che non sono autorizzato al suo utilizzo!
Devi attenerti scrupolosamente alla procedura di base: prima devi caricare il file settings.xml e in Options—>Preferences—>Site nel campo Project: scrivi "wikipedia" (senza le virgolette) e in Language: scrivi "it" (senza le virgolette) e solo dopo fai il login con il tuo nome utente (o del bot) più la password. Attenzione! è sempre quello indicato l'ordine da seguire, altrimenti ottieni questo risultato. Se premi su |Ok| sei indirizzato alla pagina di servizio inglese di AWB. Infatti la lingua predefinita è proprio l'inglese ed evidentemente non hai ancora il permesso per condurre AWB su en.wikipedia.
- ...durante un blackout del database di Wikipedia ho visto bene che AWB continuava a lavorare?!
Bisognerebbe comprendere dove e come si è manifestata la temporanea interruzione del flusso. Per esempio durante il volontario oscuramento della versione italiana nell'autunno 2011 per protesta contro il cosiddetto "Decreto ammazzablog", AWB ha avuto l'accesso aperto (lettura & scrittura) per 20 minuti oltre quello imposto ai normali browser e, in sola lettura, per tutto la durata dell'oscuramento (alcuni giorni). Questo avviene perché l'automatismo accede al database tramite un server dedicato. Per quel po' che può valere una semplice immagine ecco la situazione nelle ore pomeridiane (fuso orario CEST) del 5 luglio 2012. Vero è che a volte il malfunzionamento è a livello del server dedicato per cui è impossibile lavorare con AWB.
- ...se mentre lavori con AWB qualcuno (per esempio io) modifica la pagina dei typos mi aspetto che essa sia subito disponibile nel "motore" di AWB
Teoricamente sì. In pratica la procedura che garantisce il corretto caricamento dell' ultima versione della pagina da te indicata, prevede la totale chiusura di tutte le copie di AWB attive su it.wikipedia.org seguito da un nuovo lancio di tutte le copie. Occorrerà un po' di tempo e pazienza perché tutti i software siano allineati all'ultima versione dei Typos... e comunque non è detto che tutti i manovratori carichino quella pagina. Alcuni dovranno svolgere specifici interventi durante i quali si sentirebbero intralciati se si dovessero occupare anche degli errori ortografici.
Espressioni logore
[modifica | modifica wikitesto]- ...mi pare che qui non avresti dovuto correggere "rilasciare" con "concedere". Mi sembra eccessivo e da non fare con un bot...
- * Risposta breve:
In effetti un bot deve eseguire delle sostituzioni standard, cioè senza eccezioni di sorta. In teoria l'operatore potrebbe addirittura assentarsi dal PC dal quale opera il bot, anche se ciò non è mai consigliato. Nel caso specifico dovrebbe essere proprio come tu scrivi ma... la modifica è stata fatta dalla mia utenza ordinaria la quale non agisce come un bot. Non agendo come un bot può prendersi un po' di tempo per esaminare quale debba essere un sinonimo per evitare che in una voce ricorra in modo eccessivo lo stesso termine.
- * Risposta lunga:
Ai miei tempi, nel Medioevo, esisteva ancora l'uso dei sinonimi. Oggigiorno lo snobismo anglomane, spacciato per innovazione e ricchezza stilistica, si espande a campi nei quali non v'è la benché minima necessità o convenienza di intendersi tramite l'impiego di un glossario tecnico anglosassone. Se qualcuno mi ha poi fatto notare che nel maggio 2012 avrei raggiunto centomila edit (ecchissenefr***) e se ciò corrispondesse a verità potrei dire qualcosa in merito ai mila e mila abusi di molti termini oramai omologati, appiattiti, cristallizzati, fossilizzati nel lessico italiese contemporaneo. La stragrande maggioranza dei termini da me osservati si possono ricondurre, in ossequio alla pigrizia mentale o a lacune scolastiche, a una pedestre traduzione o alla prima eccezione che si trova scritta nei dizionari bi-lingue.
Release è rilascio.
Ai miei remoti tempi un gas, una reazione termonucleare, uno pneumatico scoppiato, una bottiglia di spumante stappata, un profumo... emettevano, liberavano, sprigionavano, esalavano dei gas, rumori o altri accidenti. Oggi, sempre e unicamente, li rilasciano: (release). Gli Avvisi ai naviganti e il Meteomar non li si emettono, li si rilasciano (release). Un tempo la colonna di un film, un brano di un album, una versione di un software, un libro, venivano pubblicati.
Ora vengono rilasciati. Le release, appunto.
Il buffo è che per qualcuno l'adattamento al lessico italiano o addirittura la sua traduzione non esistono. La truaduzione (sic) di cover in italiano e'... cover! :P. Se non esiste la traduzione non si sa di ciò che stiamo parlando.
Avrai le mie scuse solo quando una persona fermata dalla Questura anzicché essere rilasciata, troverai da me "corretto": l'amica della portinaia, innocente, fu quasi subito pubblicata.
False correzioni
[modifica | modifica wikitesto]- ...mi è capitato di trovare corretto pero (sostantivo) con però (congiunzione coordinativa avversativa) vedi qui. Non potresti fare in modo che in futuro AWB non compia questa correzione?
In teoria si potrebbe fare come tu dici ma:
- vi sono utenze che scambiano la congiunzione col noto albero e bisogna tenerne conto;
- nella stessa linea vi erano altri errori (veri, come puoi verificare dal campo oggetto) e AWB in tali condizioni è restrittivo: o corregge tutto (comprese le false correzioni) o non corregge nulla su quella linea (tramite un doppio clic sulla fascia che contiene l'errore o gli errori —veri o falsi che siano).
Tuttavia si può tentare di intervenire "chirurgicamente" sul "falso positivo" con il browser integrato in AWB. La difficoltà è insita nel fatto che il server a cui AWB è connesso lascia aperta la connessione per pochi secondi dopo di che occorre ri-domandare al server il contenuto della pagina. Se si è veloci tutto dovrebbe essere salvato secondo le intenzioni, in caso contrario si perdono tutte le modifiche manuali fatte col browser integrato.
Nel caso che hai indicato non era possibile fare altrimenti e cioè ho preferito correggere *tutto* e poi in una seconda sessione di lavoro correggere manualmente. Per chi ha il flag di bot potrebbero esservi delle difficoltà operative perché l'attuale policy non prevede che la medesima utenza che si usa per le correzioni automatiche esegua delle correzioni extra a mano.
Date
[modifica | modifica wikitesto]- ...perché AWB sta inserendo le minuscola in anni Novanta, anni Sessanta, e toglie anni '40, anni '50 mettendo al loro posto anni quaranta, anni cinquanta...?
Perché è la regola attualmente presente (23-7-2012) nel Manuale di stile di Wikipedia nella sezione decenni.
Numeri in formato ibrido
[modifica | modifica wikitesto]- ...stai correggendo 18enne, 29enne, 41enne, ecc. in diciottenne, ventinovenne, ecc. Non si possono lasciarli così? Sono oltretutto anche più brevi!
No, il suffisso enne è errato perché è errato il modo usato per indicare una quantità numerica. Fra l'altro Wikipedia non è una tipografia editoriale o un magazine o la redazione di un Tiggì dove lo spazio e il tempo sono tiranni e la brevità un obbligo. Quelle che hai indicate ti informo che sono forme di scrittura errate stando alle norme legali internazionali. Trascendendo in errori: sono errate anche le forme 25nali, 25nnali, 25ennali e simili.
Quindi si deve scrivere: trentunenne e non 31enne, trentennali e non 30ennali, ecc. sempre che non siano citazioni testuali reperite al di fuori di Wikipedia e facilmente documentabili.
Se stesso
[modifica | modifica wikitesto]- "...se seguito da "stesso" e "medesimo" NON va accentato!
Si tratta di una regola priva di fondamento e quel che è peggio è che a molti di noi è stata presentata sui banchi scolastici come norma inderogabile. Ti invito a leggere questa sezione sull'accento distintivo sui monosillabi e anche i collegamenti esterni.
Con l'occasione ti invito a controllare meglio il contenuto del campo oggetto delle mie modifiche (eseguite con l'aiuto di AWB) perché non viene corretto il pronome "se stessa/e/o/i" ma il pronome personale riflessivo di terza persona maschile e femminile singolare e plurale preceduto da una preposizione semplice. Esempio: di, a, da, in, con, su, per, fra, tra se (al posto del corretto sé) e AWB corregge solo in tale senso. Esempio: replaced: su se → su sé,; ecco comunque un esempio più esplicito dove è chiaramente visibile che né io né AWB analizziamo la presenza o l'assenza dell'accento. Nel giugno 2012 ho avuto modo di chiarire a due o tre utenti alcuni punti che qui riporto sinteticamente:
- Non è una banalità far comprendere ad AWB che quando incontra la sequenza di-a-da-in-con-su-per-fra-tra se stessa-e-i-o deve tralasciare una qualunque forma di aggiunta o rimozione di accento su se;
- Quand'anche si riuscisse a istruirlo nel modo predetto, resta il fatto che all'interno di varie voci si ha un'oscillazione fra entrambe le forme grafiche. La soluzione che di solitio si adotta è quella di uniformare la grafia. L'attuale orientamento di discreta parte dei grammatici propende per la non necessità di non accentare (vedasi link alcune righe più sopra);
- Vi è infine la presenza di accenti errati per cui: vi è da sostituire l'accento errato sè stess* con quello esatto: sé stess*.
In definitiva vi sarebbero da affrontare tre complicazioni per un accento... Se qualcuno ha un'idea (anche solo un abbozzo) può sempre comunicarla dal momento che personalmente trovo interessante cimentarmi in soluzioni (meglio se semplici) di nuovi problemi (meglio se non troppo complessi). Grazie.
Un buon suono intervocalico
[modifica | modifica wikitesto]- ...perché togli/aggiungi la "d" dopo la "A/a" e la "E/e"?
Per motivi d'eufonia. Consulta questa sezione. Se tuttavia la correzione tramite AWB avesse malauguratamente prodotto un accostamento cacofonico, ti prego di segnalarmi l'inconveniente tramite una differenza di versione scrivendo in quest'altra pagina. Grazie.
Parole di origine non italiana
[modifica | modifica wikitesto]- ...credo che ormai [la parola] si può considerare entrata nell'uso comune italiano. Forse non si trova ancora in tutti i dizionari, ma [omissis] per ciò non ritengo la si debba scrivere in corsivo o tra virgolette...
La regola sulla grafia dei termini di origine non italiana è leggibile in questa sezione. Un approfondimento del corsivo è invece in questa pagina.
Per l'uso del corsivo estraggo questa parte:
«Le parole appartenenti a lingue diverse dall'italiano (incluso il latino e ogni altra lingua morta che usi l'alfabeto latino) vanno sempre indicate in corsivo, escluse quelle entrate nell'uso comune italiano (ad esempio: marketing, computer, mouse) e quelle scritte in alfabeti non latini (ad esempio: Кириллица, Ελληνικό, عَرَبيْ, עִבְרִית).
Per capire in generale se una parola possa essere ritenuta italiana oppure no, basatevi sulle marche linguistiche presenti su un (buon) dizionario d'italiano, all'occorrenza anche più d'uno (ovviamente tenendo presenti le eccezioni su indicate).»
La questione consiste nello stabilire se:
- il termine è entrato nel lessico non specialistico quotidiano e
- se è comprensibile per tutti.
Considera che non è obbligatorio per un (buon) vocabolarista fare precedere studi statistici sulla penetrazione di un termine non italiano prima della compilazione di un (buon) dizionario e, d'altra parte, non possiamo farli noi o basarci su mere supposizioni su "sentito dire" o su un "mi pare". Sempre dalla policy estraggo:
«Bisogna inoltre tener presente che molte parole straniere, seppure di uso corrente, dispongono di sinonimi italiani (ad esempio "week-end" si può facilmente sostituire con "fine settimana"): usare la forma italiana evita qualunque imbarazzo di questo genere (forma del plurale e del singolare, corsivo o no ecc.), per cui è spesso la soluzione migliore anche quando la traduzione o adattamento non è molto comune (anche perché in genere a un primo incontro è comunque più comprensibile dell'originale, ed essere comprensibili anche per i "non addetti ai lavori" è particolarmente importante per un'enciclopedia come Wikipedia).»
Per dirimere concretamente la questione è opportuno stabilire prima di tutto se:
- non ho tenuto conto che su Wikipedia esisteva la corrispondente voce "esplicativa" (a prescindere che si trovi allo stato di abbozzo o già matura)
- in tale caso posso istruire AWB affinché aggiunga un wikilink "esplicativo" alle voci che ne sono prive.
- Ho tenuto conto che su Wikipedia non esiste un simile termine
- in tale caso sentiti-sentitevi libero-i di creare la voce; se essa continuerà a mancare e-o se sussistono dubbi sulla sua comprensione della popolazione italo-parlante, in tal caso è giustificato l'uso del corsivo.
- ...ti faccio notare che Look è una voce già presente in Wikipedia e trendy è oramai entrato nella lingua italiana. Perché li inserisci in corsivo?
Il motivo è semplice. Io leggo molto (anche) Wikipedia e il termine look l'ho scoperto utilizzato in una "marea" di accezioni, di significati che vanno molto ma molto al di là del contenuto leggibile nella voce: look. Lo vedo riferito a cose, animali e persone sia nella loro interezza che nelle loro rispettive particolarità, ivi compresi gli stati d'animo e i sentimenti e nei contesti più disparati e disperati: (all’inizio i consumatori adottano un certo look (acquistano un bene). Evidentemente c'è qualcosa di indefinito e un'enciclopedia deve essere chiara quando espone i concetti. Quanti poi non conoscono l'inglese ne sapranno quanto prima leggendo look o look. Quindi ci sono due aspetti: chi ha scritto look doveva esplicitare (ma non l'ha fatto) e io non ho tempo per cercare i migliori significati di look. Altro non rimane che scriverlo in corsivo in attesa di una eliminazione dell'evasività del termine look. Idem per trendy.
Il segno #
[modifica | modifica wikitesto]- ...AWB sostituisce # con "numero" e "vs" con "contro": ti sei accorto che è scritto così anche sulla Wiki inglese?
I Paesi anglofoni usano quel sistema di notazione che però non è applicabile in italiano. Se spedisci una raccomandata in via Vattelapesca #154 o in: 154, via Vattelapesca, l'impiegato postale, magnanimo perché non la rifiuta, però te la correggerà con: via Vattelapesca, 154 oppure: n.154.
La policy applicata scrivendo su Wikipedia è in questa sezione dalla quale estraggo:
«Evitare l'abbreviazione di uso statunitense # (cancelletto o diesis) al posto di n. (meglio ancora sarebbe numero per esteso...»
Le uniche eccezioni sono rappresentate dalle citazioni verbatim e-o da trascrizioni di titoli di opere, di gare, di competizioni, di tornei.
Vi sono tuttavia casi nei quali colui che scrive ignora il significato del segno #.
- ...bene. Allora ti informo che # e "vs" fanno parte del titolo!
Oltre a non essere onniscente io non sono tenuto a conoscere se ciò a cui ti riferisci è un titolo originale o una libertà linguistica. AWB, nel rispetto generale della policy qui sopra indicata, deve correggere come ha fatto. Se è come tu dici, se ne sei più che sicuro, allora devi inserire nel titolo e solo nel titolo l'apposto template predisposto per impedirne la correzione da parte di bot.
Scritture a norme SI e nomi propri
[modifica | modifica wikitesto]- ...ti faccio notare che qui [[link]] hai sbagliato perché hai sostituito cc con cm³ e 100Km con 100 km ma è proprio il nome del veicolo (auto, moto, ecc.), della categoria e della gara!
Sono addolorato della svista... ma non sono addentro agli eventi sportivi e non sono tenuto a conoscerli mentre siamo co-obbligati a rispettare queste norme legali.
Perciò, se sei assolutamente certo della grafia, ti prego di inserire l'apposito template per impedire che i bot correggano e che, se non lo conosci, ti comunicherò personalmente onde evitare abusi (nel presente contesto è fuori luogo).
- ...perché invece di usare AWB per questi non lo usi per correggere i veri errori?
AWB è un software che corregge in funzione del contenuto di questa pagina, mentre il file settings.xml una volta che è stato compilato, per esempio sul contenuto di quest'altra, applica ai testi dell'enciclopedia anche le sostituzioni indicate dall'operatore. Non entro nel merito di quali siano i veri errori di cui parli dal momento che la sola presenza/assenza nei dizionari (moderni) non sempre fornisce una risposta soddisfacente, vale a dire precisa. A proposito delle delle correzioni di minore entità potresti leggere le correzioni di minore entità e se hai suggerimenti, sentiti libero di scrivermi
[modifica | modifica wikitesto]- ...non capisco proprio la necessità che tu inserisca dal momento che il risultato grafico è immutato e il testo risultante in fase di editing mi confonde!
Hai le tue sacrosante ragioni (di mero carattere estetico) solo nell'ultima parte della domanda perché alcuni di noi preferiscono inserire al posto di il template {{TA|}}. Tale scelta mi riesce solo a mano, non con AWB. Personalmente la prediligo, a mano, solo in indicazioni abbastanza complesse come, per esempio: {{TA|15 218 218,37 m²}} invece di 15 218 218,37 m². Nota: entrambe le scritture porgono lo stesso risultato e sono accettate scrivendo su Wikipedia. Hai invece semplicemente torto quando affermi che ...il risultato grafico è immutato.
Ti suggerisco di leggere Spazio unificatore, Hard space, Entità (markup), Sostituzioni periodiche (non vanno sostituiti: , >, <) e se non ti rincresce puoi fare tu stesso delle prove pratiche per toccare con mano la differenza.
Se ti può interessare, ci sarebbero sono da correggere un sacco di scritture errate. Per indicare una distanza o un tempo o quello che si vuole, ci sono utenze che, sia pure in buona fede, fanno un uso errato delle convenzioni internazionali del SI. Cinque kilometri, cinque tonnellate, cinque minuti, cinque litri, ecc. sono, a volte, così scritti: 5k/Km, 5t, 5min, 5l invece di: 5 km, 5 t, 5 min, 5 l, ecc. Sotto tali premesse l'entità serve anche per scindere una parte numerica erroneamente attaccata senza soluzione di continuità al suo simbolo metrologico. Poniamo ora il caso (mica tanto ipotetico) che in 5km vi sia un errore nella quantità numerica la quale debba essere sostituita con 5,17. Cerchiamo di predire il comportamento di un contribuente ignaro delle norme SI. Si presume che da 5m si passi a leggere cosi: 5,17m. L'errore permane! Pertanto ho istruito AWB in modo che trovandosi in presenza di tali errori agisca come un "deterrente" (ecco un primo esempio di errore xMHz e un secondo esempio però eseguito a mano) per evitare futuri inserimenti di scritture non a norme SI e cioè separando la parte numerica dal simbolo letterale con uno spazio vuoto (non spezzabile!) tramite .
Per esempio si può trovare questo genere di scritture: se, per un qualunque motivo, si dovesse aggiornare la parte numerica, il simbolo potrebbe essere mantenuto così come è: fuori dagli standard. La correzione fatta con AWB ha eliminato l'errore per sempre...
C'è infine da osservare che serve anche a mostrare visivamente l'effetto di più spazi vuoti consecutivi. Se per qualunque motivo fosse necessario separare due caratteri di stampa con due o più spazi vuoti con o senza l'uso di il risultato potrebbe essere questo:
|Squadra 1| |Squadra 2| (senza ) (vedi il sorgente della pagina)
|Squadra 1| |Squadra 2| (con ).
- ...sempre a proposito di spiegami questo: perché metti quell'entità in un elenco composto di righe di pochissimi caratteri?
Quando trovo le situazioni alle quali ti riferisci (e null'altro) salto a piè pari quella voce. Se dai un'occhiata alla differenza di versioni è quasi certo che il mio assistente (AWB) abbia trovato altre cose da sbrigare all'interno del testo oppure errori entrocontenuti proprio nelle righe brevi Ghz->GHz. Se il numero delle brevissime righe da spuntare che contengono eccede un certo quantitativo a me occorre un po' di tempo per deselezionarle a mano e così scade anche il tempo entro il quale il server attende una risposta da AWB. Quando il server comunica che AWB è fuori tempo, il risultato è che perdo tutto il lavoro fatto fino a quel punto su quella voce! Quindi, delle due l'una: o correggo tutto compreso gli errori ortografici, i refusi, la formattazione, ecc. oppure ignoro tutto. Cosa mi suggerite?
- ...ho visto che hai annullato la mia modifica: mi spieghi perché i punti fra le migliaia non vanno bene?
L'ho annullata perché tu reinserendo il punto hai peggiorato la situazione nel rispetto delle più volte ricordate norme internazionali SI. Leggi: Separatore decimale e Aiuto:Manuale_di_stile#Numeri. Se invece al posto di ti va di inserire il template {{TA|5 000 000}}, ben venga e... grazie!
<br /> et <small> </small>
[modifica | modifica wikitesto]- ...perché togli <br /> e <small> </small>?
AWB, pur nei suoi limiti, si attiene all'usabilità del web. Quando incontra quel tag all'interno delle note e nelle didascalie li rimuove perché il carattere diventa troppo piccolo per essere di facile lettura. A volte è necessario che qualcuno (io) lo forzi a rimuovere anche all'interno del testo in quanto il suo impiego non è giustificato. Invece <small> non lo si rimuove dai template perché il suo uso è stato oggetto di un consenso comunitario.<br />
Per la rimozione di <br /> dai un'occhiata al termine del paragrafo qui sopra. Qualcuno ha richiesto di andare a capo e, a seguire, una interruzione di linea. È decisamente superfluo.
(proseguirà...)
Dedicato a...
[modifica | modifica wikitesto]- tutti coloro che dicono che AWB confonde chi va a modificare la voce;
- tutti coloro che dicono che AWB non è/sarebbe in grado di correggere soddisfacentemente nel rispetto delle norme internazionali SI. Per inciso: è un caso di media difficoltà: si noti, fra gli altri errori, un errato inserimento di punti "." dopo i simboli e relativa eliminazione previa scrittura di regoletta in Normal settings. Infatti (e purtroppo) non è un errore isolato...
Tabella di riepilogo
[modifica | modifica wikitesto]- Attenzione! Quando si parla di "voci" si intende sempre "lista di titoli di voci" non lista di contenuti! Se per esempio oggi compilo una lista e fra X giorni la ricarico in memoria, il contenuto che andrò a correggere è quello in essere alla data dell'operazione di correzione degli errori.
- Se non diversamente indicato la funzione utilizzata per la generazione delle liste in tabella è: Source:Random pages.
Dall'8 aprile 2012 ho iniziato a inserire nel mio file settings.xml alcuni errori di spaziatura fra le parole terminanti e inizianti con le vocali e separate da una virgola senza spazio a seguire (errore comune). Esempio: a,a —> a, a —— i,e —> i, e[22]. - Se non diversamente indicato, AWB corregge gli errori caricando in memoria la pagina dei Typos più il contenuto del file settings.xml.
- Alle liste generate con la funzione Wiki search: AWB applica nelle pagine visitate alcune correzioni aggiuntive al termine errato cercato. Infatti AWB l'ho configurato per scoprire il numero più elevato di errori e non un unico termine errato.
- Dal 15 aprile 2012 00:00:00 CEST al 19 aprile 2012 23:59:60 CEST era attiva la sostituzione: Ad un(a), ad un(a) --> A un(a), a un(a).
- Dal 16 giugno 2012 15:00 CEST è attiva la sostituzione sperimentale di 2—3—4 spazi vuoti fra le parole a favore di un solo spazio.
- Per le liste generate con la funzione Source:New pages sarebbe auspicabile che gli utenti interessati coordinassero (magari in una pagina all'uopo destinata) le rispettive operazioni al fine di evitare inutili sovrapposizioni. Nel presente contesto che mira a quantificare percentualmente gli errori, può rivelarsi utile specificare, oltre la data, l'orario di formazione della lista come da tabella sottostante.
- AWB dovrebbe essere in grado di elaborare una lista composta da un massimo di 25 000 voci[senza fonte]. [23][24][25]
Il colore delle celle indica alcune specifiche funzioni di ricerca usate da AWB.
Nuove pagine —> (numero massimo di voci: 500)
Ricerca Wiki (per testo oppure per titolo) —> filtrabile per namespace(s)
Ricerca casuale (random pages) —> numero minimo di voci: 10
Ricerca per Categoria —> fissabile il limite del livello di profondità
Contributi di un utente —> filtrabili per namespace(s)
Progr.vo | Data di calendario | Liste | Voci in lista (A) | Voci con errori (B) | % (B ÷ A) × 100 | Annotazioni |
---|---|---|---|---|---|---|
1 | 3 aprile 2012 | 1 | 2 000 | 235 | 11,75 | |
2 | 4 aprile 2012 | 1 | 200 | 20 | 10 | |
3 | 4 aprile 2012 | 1 | 200 | 20 | 10 | |
4 | 4 aprile 2012 | 1 | 500 | 54 | 10,8 | |
5 | 5 aprile 2012 | 1 | 800 | 93 | 11,625 | |
6 | 6 aprile 2012 | 1 | 1 200 | 152 | 12,667 | |
7 | 7 aprile 2012 14:50 CEST | 1 | 500 | 59 | 11,8 | Source:New pages |
8 | 7 aprile 2012 | 1 | 500 | 59 | 11,8 | |
9 | 8 aprile 2012 | 1 | 933 | 183 | 19,614 | Category:Correggere (RecursionDepth:5) |
10 | 8 aprile 2012 | 1 | 700 | 81 | 11,571 | |
11 | 9 aprile 2012 | 1 | 1 600 | 195 | 12,188 | |
12 | 10 aprile 2012 | 1 | 119 | 68 | 57,143 | Category:Passi e valichi della Svizzera (RecursionDepth:5) |
13 | 11 aprile 2012 14:30 CEST | 1 | 500 | 101 | 20,2 | Source:New pages |
14 | 11 aprile 2012 | 1 | 500 | 60 | 12 | ora file: 19:33 CEST |
15 | 12 aprile 2012 | 1 | 1 500 | 175 | 11,667 | |
15 | 15 aprile 2012 | 1 | 1 200 | 196 | 16,25 | ADD:flashback->flashback; ENABLED:ad un Ad un REPLACED:d cacofonica dove occorre |
17 | 16 aprile 2012 | 1 | 1 200 | 230 | 19,167 | |
18 | 17 aprile 2012 14:26 CEST | 1 | 500 | 114 | 22,8 | Source:New pages |
19 | 18 aprile 2012 | 1 | 582 | 206 | 35,395 | Wiki search:albums (truncated list) |
20 | 19 aprile 2012 | 1 | 1 050 | 175 | 16,667 | |
21 | 20 aprile 2012 | 1 | 1 050 | 196 | 18,667 | DISABLED:ad un Ad un |
22 | 21 aprile 2012 11:38 CEST | 1 | 500 | 78 | 15,6 | Source:New pages |
23 | 21 aprile 2012 | 1 | 466 | 92 | 19,742 | Category:Videogiochi_sportivi (RecursionDepth:6) |
24 | 22 aprile 2012 | 1 | 1 500 | 176 | 11,733 | |
25 | 23 aprile 2012 | 1 | 2 510 | 334 | 13,307 | |
26 | 24 aprile 2012 | 1 | 900 | 110 | 12,222 | |
27 | 26 aprile 2012 | 1 | 20 | 18 | 90 | Wiki search:connubbi[26]. |
28 | 26 aprile 2012 | 1 | 265 | 118 | 44,528 | Wiki search:perchè |
29 | 27 aprile 2012 13:37 CEST | 1 | 500 | 92 | 18,4 | Source:New pages |
30 | 30 aprile 2012 | 1 | 4 952 | 1 283 | 25,909 | Category:Categorie_per_personalità (RecursionDepth:6) |
31 | 1 maggio 2012 | 1 | 1 300 | 240 | 18,462 | |
32 | 2 maggio 2012 | 1 | 7 552 | 188 | 2,489 | Category:Aiuto |
33 | 2 maggio 2012 | 1 | 800 | 132 | 16,5 | |
34 | 4 maggio 2012 | 1 | 1 000 | 177 | 17,7 | |
35 | 4 maggio 2012 16:25 CEST | 1 | 500 | 61 | 12,2 | Source:New pages |
36 | 6 maggio 2012 | 1 | 2 386 | 599 | 25,105 | Category:Etica (RecursionDepth:5), (2386 of 3454 articles) |
37 | 7 maggio 2012 | 1 | 1 600 | 251 | 15,688 | |
38 | 8 maggio 2012 | >10 | 1 257 | 183 | 14,558 | |
39 | 10 maggio 2012 | 1 | 1 000 | 150 | 15 | |
40 | 11 maggio 2012 17:09 CEST | 1 | 500 | 71 | 14,2 | Source:New pages |
41 | 14 maggio 2012 | 1 | 170 | 89 | 46,471 | Wiki search:22enne |
42 | 17 maggio 2012 | 1 | 1 300 | 213 | 16,385 | |
43 | 22 maggio 2012 13:33 CEST | 1 | 500 | 82 | 16,4 | Source:New pages |
44 | 25 maggio 2012 | 1 | 1 200 | 139 | 11,583 | |
45 | 2 giugno 2012 | 1 | 1 300 | 183 | 14,077 | |
46 | 6 giugno 2012 | 1 | 267 | 144 | 53,933 | Category:Cellulari Nokia (RecursionDepth:4) In massima prevalenza scritture non a norme legali. Non ho corretto i punti usati in modo errato come separatori decimali. |
47 | 7 giugno 2012 | 1 | 1 500 | 177 | 11,8 | |
48 | 9 giugno 2012 | >10 | 870 | 100 | 11,494 | |
49 | 11 giugno 2012 11:33 CEST | 1 | 500 | 78 | 15,6 | Source:New pages |
50 | 16 giugno 2012 | 1 | 1 200 | 234 | 19,5 | Compresa parziale sostituzione spazi vuoti ripetuti con 1 spazio singolo |
51 | 18 giugno 2012 | >10 | 371 | 100 | 26,954 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
52 | 20 giugno 2012 | >10 | 600 | 150 | 25 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
53 | 25 giugno 2012 | >10 | 681 | 184 | 27,019 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
54 | 29 giugno 2012 | >10 | 556 | 144 | 25,899 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
55 | 2 luglio 2012 11:09 CEST | 1 | 500 | 105 | 21 | Source:New pages |
56 | 7 luglio 2012 | >10 | 590 | 130 | 22,034 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
57 | 10 luglio 2012 | 1 | 837 | 207 | 24,731 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
58 | 11 luglio 2012 | >10 | 504 | 180 | 35,714 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
59 | 19 luglio 2012 | 1 | 1 186 | 580 | 48,904 | Category:Montagne delle Alpi (RecursionDepth:6) (Truncated list) |
60 | 13 agosto 2012 | 1 | 700 | 127 | 18,143 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
61 | 1 settembre 2012 | 6 | 600 | 99 | 16,5 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
62 | 4 settembre 2012 | 2 | 600 | 122 | 20,333 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
63 | 8 settembre 2012 15:00 CEST | 1 | 500 | 86 | 17,2 | Source:New pages |
64 | 22 settembre 2012 11:28 CEST | 1 | 500 | 106 | 21,2 | Source:New pages |
65 | 25 settembre 2012 | 2 | 550 | 97 | 17,636 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
66 | 26 settembre 2012 | 1 | 500 | 101 | 20,2 | Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo |
67 | 3 ottobre 2012 9:16 CEST | 1 | 500 | 78 | 15,6 | Source:New pages |
68 | 14 ottobre 2012 14:47 CEST | 1 | 500 | 63 | 12,6 | Source:New pages. Circa 243 voci create da Gacbot prive di errori |
69 | 26 ottobre 2012 | 1 | 340 | 150 | 44,118 | User contribs:Eumolpo. Utente molto attivo nelle correzioni ortografiche. |
70 | 25 marzo 2013 | 1 | 1 050 | 250 | 23,810 | |
71 | 26 marzo 2013 | 1 | 100 | 31 | 31 | |
72 | 12 aprile 2013 14:34 CEST | 1 | 500 | 100 | 25 | Source:New pages |
73 | 16 apr 2013 | 1 | 401 | 171 | 42,643 | Wiki search:Istituto geografico militare (truncated list: 401 of 1000) |
74 | 4 set 2013 | 4 | 600 | 130 | 21,667 | |
75 | 17 set 2013 | 1 | 272 | 130 | 47,794 | Wiki search:T.A.T.u (truncated list) |
76 | 13 nov 2013 | 4 | 600 | 108 | 18 | [1 50] [1 100] [1 150] [1 300] |
77 | 19 nov 2013 | 3 | 700 | 137 | 19,571 | [1 100] [1 100] [1 500] |
78 | 21 nov 2013 | 1 | 699 | 520 | 74,392 | Category:Contee degli Stati Uniti d'America. (RecursionDepth:6) (Truncated list) Da: stato/i a: Stato/i |
79 | 8 dic 2013 | 1 | 300 | 92 | 30,667 | Wiki search:22enne |
80 | 29 gen 2015 | 4 | 400 | 61 | 15,25 | [1 100] [1 100] [1 100] [1 100] |
81 | 7 feb 2015 | 1 | 500 | 62 | 12,4 | |
82 | 12 feb 2015 | 3 | 450 | 63 | 14 | [1 150] [1 150] [1 150] |
83 | 14 mar 2015 | 1 | 500 | 91 | 18,2 | |
84 | 26 ago 2015 | 1 | 500 | 69 | 13,8 | |
riga85 | ? | |||||
riga86 | ? |
(proseguirà...)
Note
[modifica | modifica wikitesto]- ^ Ultime 1 400 modifiche nella pagina di servizio per l'elaborazione degli errori e il contributo delle utenze partecipanti.
- ^ Contributi eseguiti con AWB dal luglio 2010 alla data indicata dagli indici nello screenshot
- ^ Caratteristiche delle varie versioni in ordine di uscita. Il 4 settembre 2012 è uscita la versione 5.4.0.0 sensibilmente migliorata rispetto alle precedenti
- ^ Una lista contiene, nel presente test, unicamente i soli titoli delle voci formattati, prive dei contenuti i quali vengono caricati in memoria ed elaborati quando in AWB si preme Start.
- ^ Sebbene l'attuale file setting.xml contenga tutte le mie regex e i miei Find and replace ricordo che i Typos della pagina di servizio caricati in automatico non sono selezionabili singolarmente (all'aprile 2012 ammontavano a 119 sulla pagina apposita di Wikipedia italiana e a circa 280 nell'agosto 2012). AWB è perciò un automatismo ad ampio spettro di correzione (a meno di non disabilitare i Typos "esterni" e operare con il solo Find and replace "interno" di minime dimensioni)
- ^ Le correzioni effettivamente salvate sono state 235
- ^ Nella attuale configurazione e in un paio d'anni di uso non ho mai esperito il crash di AWB
- ^ Come "caso limite" mi riferisco alle pagine in NS:0 (giacché il test è circoscritto a questo namespace) che non sono inserite fra gli osservati speciali di nessun utente
- ^ Le altre raccolte di errori sono contenute di default nei file di AWB (in specialissimo modo quelli attinenti alla wiki-formattazione ma non modificabili dall'operatore) e nella pagina dei Typos. Quando AWB attinge a quella pagina scrive nel campo oggetto delle modifiche: , typos fixed:...
- ^ esempi fra i tanti: locuzione "fin da subito" e il punto di vista del prof. Giovanni Nencioni a proposito se si dica terapeuta o terapista?. Non è sufficientemente chiaro cosa abbia da spartire la nascita di una professione con l'etimologia preesistente della parola sulla quale la professione si innesta.
- ^ Accademia della Crusca: D eufonica
- ^ Sulla D eufonica su Wikipedia
- ^ Ma attenzione a non esagerare: se si parla di triangoli sarebbe inutile e ridicolo sostituire qua e là con: figura a tre lati/angoli...
- ^ mi riferisco alla versione specializzata messa in opera per essere utilizzata dai dispositivi mobili
- ^ I link esplicativi che, all'interno di una voce, non puntano ad altre voci già presenti su Wikipedia sono in numero talmente elevato da far propendere che coloro che hanno redatto le voci davano per scontato che il termine, nell'eccezione usata, fosse non solo presente in tutti i dizionari inglesi (mica parlo degli italiani nei quali il termine è presente per necessità editoriali), ma fosse entrato nell'uso comune di tutti gli italoparlanti e perciò perfettamente comprensibile. È impossibile elencare tutti i tecnicismi di cui sono infiorettate le voci di sport, musica, spettacolo, tanto per citare quelle fra le più bombardate. In un mio dizionario di inglese (in edizione maggiore di una notissima casa editrice) cheerleader è solo ed esclusivamente quella persona che nei palcoscenici televisivi è incaricata di dare la stura agli applausi. Le cheerleader(s) credevo fossero le "ragazze pon pon" ma qualcuno mi ha fatto notare che non è così... Reunion si traduce con "riunione" (meno male) ma cover oltre che significare "reinterpretazione" assume anche il significato di "custodia, copertina, astuccio" e finalmente mi si dice nella mia pagina utente di non tradurre con reinterpretazione perché cover è voce entrata nell'uso comune. Alla faccia di chi ha scritto la voce cover dove per tre volte si trova il termine "reinterpretazione". Coverizzare sa di studi trascendentali. Vocalist non si traduce con "cantante" perché esegue particolari melodie che lo differenziano (e quali, di grazia, se il redattore ha omesso nel wikitesto italiano la corrispondente aggettivazione inglese?); headliner non si sa cosa sia per cui AWB sa che deve virgolettarlo; la chart è la "classifica", la hit è il "successo", un sold out è un "tutto esaurito", il guitarist è il "chitarrista" l'orgia di diesis (#) non sono delle alterazioni musicali ma significa "numero" (di tipo cardinale) e così via ad libitum oltre ogni dire.
- ^ Mi sono accorto che vi sono utenze che passano il loro tempo a infarcire i testi con "wikilink" verso voci dell'enciclopedia prive di un chiaro nesso logico con l'argomento trattato. Non è detto, non mi pare proprio che il melius abundare quam deficere sia sempre una regola razionale. Una pagina con testo bi-colore (nero e blu) non è il massimo per l'occhio.
- ^ La "modalità automatica" consiste nel predisporre AWB in modo che esegua un predeterminato compito (es.: elaborazione di una lista di voci) senza che l'operatore compia "in tempo reale" alcun controllo o azione, affidando l'intero lavoro alla capacità del robot.
- ^ Fatti salvi i casi di disattenzione dell'operatore, di imperfetta regex, non ho mai esperito alcun bug del software.
- ^ AWB si appoggia sul motore di Internet explorer
- ^ Edit throttle and peak hours. L'articolo parla di limiti per i bot in funzione dell'orario di impiego.
- ^ Immagine esplicativa
- ^ Sezione "spazi nel Manuale di stile
- ^ Attualmente (11 aprile 2012) non posso dimostrare che il valore massimo sia quello indicato in quanto non è riportato nel manuale tecnico. AWB si rifiuta di formare liste contenti oltre 25 000 voci: si veda l'immagine in quanto ho all'attivo un numero di pagine editate una sola volta di molto superiore alle 25 000 voci.
- ^ Un altro esempio che avvalorererebbe il limite massimo di 25 000 voci è la richiesta di una lista sorgente da Special Pages si veda l'immagine dello screenshot.
- ^ Avviando la ricerca per la Categoria:Letteratura_per_lingua la lista che si ottiene è composta da 30 507 elementi: una volta richiesto di elencare solo le voci in NS:0 presenti all'interno della lista, queste assommavano a poco più di 19 000
- ^ La ricerca manuale di connubbi dava venti voci. Due sono state ignorate da AWB perché il termine era all'interno del template "Quote" e nell'altro caso l'errore era racchiuso fra le virgolette "connubbio". Se avessi impostato AWB in modalità da scandagliare all'interno delle citazioni, delle note in references ecc. avrei sì trovato tutte le occorrenze di "connubbi*" ma anche ottenuto dei falsi positivi per rimediare ai quali avrei dovuto deselezionarli a mano con conseguente lavoro aggiuntivo (e spreco di tempo). Punteggio di AWB: 18/20.
Voci correlate
[modifica | modifica wikitesto]Categoria:Template di ausilio ai bot
Correggi solo i collegamenti a redirect inutili
Filmo (Plugin dell'utente B3t per AWB)
Leggi e provvedimenti legislativi (Si noti la mancanza di uno spazio dopo il punto.)
Manuale di stile di Wikipedia in lingua italiana
Overlinking giorni e mesi dell'anno (Come è facile comprendere è una raccomandazione contro l'esubero dei collegamenti interni)
Team OTRS-Bot (Bot per soli compiti speciali)
Collegamenti esterni
[modifica | modifica wikitesto]Documentazione attinente al primo test eseguito
[modifica | modifica wikitesto]- Dato grezzo di entrata ordinato alfabeticamente. Non è rilevante che sia ordinato ma è utile se volessi cercare più speditamente una determinata voce.
- Dato grezzo di uscita lungo: Text file with annoted wiki markup. Permette di esaminare il lavoro da me svolto nei dettagli, sebbene presenti del testo in esubero rispetto alle normali ed eventuali esigenze di controllo del lavoro.
- Dato grezzo di uscita breve: Text file with wiki markup. È identico a quello presente in questa pagina ma non permette di controllare gl'interventi eseguiti tramite AWB.
Lingua e informatica
[modifica | modifica wikitesto]Lingua parlata e lingua scritta
[modifica | modifica wikitesto]- canIPA Natural Phonetics (particolarmente ricco di testi e documenti vari)
- Dizionario: Si dice o non si dice? Estratto dall'omonimo dizionario di Aldo Gabrielli
Linguistica
[modifica | modifica wikitesto]- Laboratorio di linguistica della Normale di Pisa (cliccare su Quaderni del Laboratorio e poi su Table of content)
Luciano Canepari
[modifica | modifica wikitesto]Canepari MFo
[modifica | modifica wikitesto]- Luciano Canepari, Italia (PDF), in MFo. Manuale di fonetica, Muenchen, Lincom, 2003. URL consultato il 13 agosto 2012.
Canepari Avviamento alla fonetica
[modifica | modifica wikitesto]- Luciano Canepari, Avviamento alla fonetica italiana, Torino, Einaudi, 2006, pp 119-128.
Canepari MaPI
[modifica | modifica wikitesto]- Luciano Canepari, MaPI. Manuale di pronuncia italiana, 2ª ed., Bologna, Zanichelli, 1999.
Canepari Web
[modifica | modifica wikitesto]- Luciano Canepari, DiPI Dizionario di pronuncia italiana (PDF), Bologna, Zanichelli, 2008 [2000]. URL consultato il 13 agosto 2012.
- Luciano Canepari, Ortoepia delle parole da A a Z (PDF), in DiPI. Dizionario di pronuncia italiana, agosto 2008. URL consultato il 13 agosto 2012.
- Luciano Canepari, Indicazioni per l'ortoepìa (PDF), in DiPI. Dizionario di pronuncia italiana, agosto 2008. URL consultato il 13 agosto 2012.
Altri
[modifica | modifica wikitesto]- AutoWikiBrowser Usage Stats (Dati statistici sull'uso di AWB)