Wikipedia:Bar/Discussioni/Ordine alfabetico di default

Ordine alfabetico di default


Allo stato attuale l'ordine alfabetico nelle categorie (per una serie di quattro parole d'esempio) è il seguente: Aardvark, Aztec, Zoo, Ärsenik. Un buon numero di Wikipedie è invece passata a un altro sistema UCA (Unicode Collation Alghoritm) che dà invece Aardvark, Ärsenik, Aztec, Zoo. Insomma con UCA potremmo ridurre drasticamente la necessità di usare {{DEFAULTSORT}} etc, ottenendo un ordinamento alfabetico naturale senza sforzo. Lo mettiamo pure su it.wiki? --Vito (msg) 01:47, 28 mag 2016 (CEST)[rispondi]

mi stupisco che non sia attivato di default. per chi fosse interessato qui dettagli tecnici, qui una demo dell'algoritmo , qui l'esempio per chi volesse testare l'ordinamento in Python (potrebbe interessare a chi utilizza il Pywikibot). --valepert 03:07, 28 mag 2016 (CEST)[rispondi]
[@ Vituzzu, Valepert] Facendo riferimento per comodità al BioBot[1], lettere come Æ, Þ e Ə (che abbiamo voci con tali lettere, come si vede al link) esattamente dove vanno ? La prima immagino tra le A, ma le altre due ?--151.67.221.180 (msg) 11:36, 28 mag 2016 (CEST)[rispondi]
Porta pazienza se invece rispondo io. Usando il demo che Valepert ha indicato, l'ordine sarebbe questo:
a Æ b c d e Ə f g h i j k l m n o p q r s t u v w x y z Þ
Per quanto riguarda la necessità di implementazione, il mio commento è simile a quello che a volte compare durante le elezioni di un admin: "Ma come, non c'era già?" :-) --Lepido (msg) 14:05, 28 mag 2016 (CEST)[rispondi]
Risulta particolarmente utile coi numeri: in ordine alfabetico è 1 100 900 99, con UCA è 1 99 100 900. --Vito (msg) 14:30, 28 mag 2016 (CEST)[rispondi]
in realtà dipende dalla Numeric collation. nella demo precedente si può fare un tentativo con questi numeri (volutamente scritti usando Halfwidth and Fullwidth Forms) con e senza opzione attivata:
1
0
10
9
101
99
100
il risultato dovrebbe essere un ordine lessicografico (off) o numerico (on) e, ovviamente, funziona anche con i corrispettivi caratteri ASCII. --valepert 15:47, 28 mag 2016 (CEST)[rispondi]
Anche per me: "Ma come, non c'era già?" :-) --Bramfab Discorriamo 15:57, 28 mag 2016 (CEST)[rispondi]
Ma questa cosa non era già stata implementata da Bultro? Sono sicuro di sì
Mi accordo ai : "Ma come, non c'era già?" (o meglio: "Ma come, non l'abbiamo?! Sarebbe meglio di sì", perché avevo notato alcune volte che l'attuale ordinamento dà un risultato di difficile comprensione e quindi di difficile usabilità).
E non abbiamo neppure le voci in italiano corrispondenti a quelle in inglese sugli argomenti citati qui: en:Unicode collation algorithm, en:Numeric collation ma anche persino la più generale en:Collation che, almeno stando agli interlink, in italiano non ci sono ancora. (Vorrei dare una mano traducendo parte di quest'ultima, ma mi areno già nel titolo. Il dizionario d'inglese mi dice che collate significa confronto, ma immagino che in questo caso significhi qualcosa tipo ordinamento, che però in inglese sarebbe un'altra parola (sorting, e infatti c'è la voce en:Sorting algorithm, almeno questa c'è anche in italiano Algoritmo di ordinamento) ). --5.170.14.228 (msg) 09:44, 29 mag 2016 (CEST)[rispondi]
Per "ordinare" occorre prima "confrontare", per sapere chi viene prima e chi dopo. A seconda quindi della collation, la "regola di confronto" applicata, può variare l'ordine degli elementi (e in questa pagina si discute proprio di questo caso) --Lepido (msg) 10:30, 29 mag 2016 (CEST)[rispondi]
il termine italiano è collazione, la cui voce al momento raggruppa significati diversi. --valepert 13:41, 29 mag 2016 (CEST)[rispondi]

Per quanto riguarda i commenti sul template Bio (e anche altri template) al momento stanno usando una funzione "collate de noartri" che ho aggiunto su richiesta di Bultro al modulo String. Questa si limita a sostituire le lettere accentose, cedigliose o con altri appendici strane con la corrispondente lettera dell'alfabeto latino. Il metodo non è perfetto perchè non stabilise un ordine fisso, per esempio tutte le varianti "ÁÀĂẮẰẴẲÂẤẦẪẨǍÅÅǺÄǞÃȦǠĄĀẢȀȂẠẶẬḀȺᴁ" sono trasformate in "A", quindi l'ordine tra le parole che iniziano per tutti questi simboli è casuale fra di loro (situazione non perfetta ma già migliorativa).. Passare a un metodo gestito a livello server come proposto da Vito sarebbe auspicabile e sono fortemente a favore.--Moroboshi scrivimi 07:39, 30 mag 2016 (CEST)[rispondi]

Mamma mia... sarebbe tanto, tanto, tanto utile!!! --Retaggio (msg) 09:40, 30 mag 2016 (CEST)[rispondi]
Per quanto riguarda l'ordinamento dei numeri nelle categorie ci stiamo vicini (phab:T8948), è già in corso una modifica al database per poterla attivare completamente. Per quanto riguarda i caratteri alfabetici, anche qui si sta pensando (da diverso tempo) ad una modifica generale per tutte le wiki, ma nel frattempo possiamo accelerare il processo chiedendo di utilizzare "uca-it" (cfr: m:Collation, phab:T47443, phab:T32996). --β16 - (talk) 10:43, 30 mag 2016 (CEST)[rispondi]

Concordo sull'uso dello standard Unicode, uca-it. Nemo 12:12, 30 mag 2016 (CEST)[rispondi]

+1 assolutamente e... fattivamente come si fa? Se lo volessi implementare su Wikizionario ci sarebbe un'anima pia disposta a darmi una mano? :) --Barbaking scusate la confusione!! 17:21, 30 mag 2016 (CEST)[rispondi]
[@ Barbaking] intanto apri una discussione al bar per raccogliere il consenso della comunità. Una volta che avrai raggiunto un certo numero di pareri favorevoli, si apre un task su phabricator: (se vuoi posso aiutarti io a farlo). --β16 - (talk) 10:08, 31 mag 2016 (CEST)[rispondi]
Fatto. --Vito (msg) 23:22, 31 mag 2016 (CEST)[rispondi]

[@ Vituzzu] non sarebbe il caso di sistemare anche le voci categorizzate con apostrofi[2] ? Magari passando un bot.--Goletta (msg) 17:34, 3 giu 2016 (CEST)[rispondi]

β16 e altri, sull'ordinamento dei numeri nelle categorie (phab:T8948), occorre ulteriore discussione o siamo d'accordo che si può procedere? --Elitre (WMF) (msg) 13:46, 21 set 2016 (CEST)[rispondi]

Purtroppo non sono riuscito a capire una cosa: il NumericUppercaseCollation è in aggiunta o in alternativa al uca-it? Nel primo caso favorevole a procedere subito. Nel secondo caso invece penso si debba analizzare i vantaggi/svantaggi dei due metodi prima di prendere una decisione. [@ Vituzzu, Nemo bis] forse voi avete qualche informazione in più? --β16 - (talk) 10:12, 22 set 2016 (CEST)[rispondi]
β16, la prima che hai detto. --Elitre (WMF) (msg) 07:53, 24 set 2016 (CEST)[rispondi]
Favorevole per me si può già chiedere a DannyH di attivare per itwiki. --β16 - (talk) 12:37, 26 set 2016 (CEST)[rispondi]
Fatto. --Elitre (WMF) (msg) 15:00, 26 set 2016 (CEST)[rispondi]
Saremo parte del prossimo gruppo che convertono. Per chiarire, mentre la transizione è in atto naturalmente l'ordine nelle categorie apparirà strano, ma l'operazione dovrebbe durare giusto un paio d'ore o poco più, per cui niente panico. Magari quando sappiamo la data precisa la mettiamo anche nel Wikipediano. --Elitre (WMF) (msg) 09:25, 27 set 2016 (CEST)[rispondi]
Dovrebbe aver finito la conversione. --β16 - (talk) 09:42, 25 ott 2016 (CEST)[rispondi]
Danny mi linka Categoria:Film_Universal_Studios come esempio e ci invita a fargli sapere se ci sono problemi ecc. --Elitre (WMF) (msg) 12:21, 25 ott 2016 (CEST)[rispondi]