InscriptionConnexion
Il y a de ça quelques semaines, je m'amusais à parcourir l'immense liste des caractères unicode (autisme) et, en épluchant une des sections dédiées aux sinogrammes (0x5000 à 0x5FFF), je suis tombé sur ce caractère là: 偍 (0x504D)

À priori tout à fait banal, 偍 cache en fait quelque chose d'assez étrange: si vous essayez de le traduire via l'intégration Google Translate à la page de résultats, vous obtiendrez un swatiska en output, peu importe la langue que vous choisissez. Pas le mot "swastika" mais bel et bien le symbole 卍 comme vous pouvez le voir ici:
Image
À noter que 偍 n'est traduit de la sorte que sur la page de résultats. Si on se rend sur translate.google.com, le traducteur ne nous donne tout simplement pas de résultats comme pour les autres idéogrammes dont il ne connaît pas la traduction:
Image
Parmi tout ceux que j'ai pu testé, c'est le seul caractère qui présente cette particularité. Par exemple, ses 2 voisins dans la table unicode (0x504C et 0x504E) possèdent eux des traductions banales au possible:
Image Image
... et c'est normal puisqu'il s'agit ici des "premiers" sinogrammes répertoriés et qui sont supposés assez communément utilisés. (d'autres idéogrammes chinois, japonais et coréens plus littéraires et rares apparaissent bien plus tard dans la liste et ont même des plans dédiés, un plan contenant jusqu'à 65 534 caractères).

VOILÀ. Je peine à trouver une explication à cette bizarrerie malgré mes efforts. Aucune mention ailleurs sur internet à ma connaissance. J'ai demandé à un ami à moi qui étudie l'informatique et qui l'a lui même partagé à ses collègues mais pas d'update.

Je me tourne donc vers vous, d'abord parce que j'aime ce petit mystère et que je voulais vous en faire part, mais aussi et surtout dans l'espoir de déboucher sur d'éventuelles pistes!
:catent:
il y a 4 mois
:Hitler_aime:
In vino veritas
il y a 4 mois
Nos chômeurs ont dû talent
:lebossgraisse:
Hurler de façon ma c'est que parceque, d'écrire continue je , pourtant et . Chien un comme traqué , humilié , méprisé
il y a 4 mois
Je croyais être un peu autiste, merci l'op de me faire relativiser
:risitas_gonfle:
3émé régiment matricule R3-14, from humain to Astartes, pour le régiment et pour l'empereur
:Risititus:
il y a 4 mois
:Nazi_lit:
¡Esta serpiente marina MATÓ a un Celestino! https://streamable.com/fmjgjb
il y a 4 mois
C'est bien sûr la première chose que j'ai faite, mais aucune réponse sur reddit ou google!
Peut-être que je cherche mal, avoir "swastika" et "google translate" en mots clés n'aide pas du tout à trouver des résultats pertinents
:aie:

Si toi ou d'autres kheyonches avez des techniques plus efficaces pour faire de genre de recherche, je suis preneur!
il y a 4 mois
Le troll d un dev chinois
:je_sais_pas:
Le rien s’imagine comme absence ; le néant détruit toute possibilité de l’imaginer .
il y a 4 mois
Attends première phrase je hurle de rire déjà
:zahi:
il y a 4 mois
Je connais pas du tout ce caractère mais je peux te dire que la partie gauche est une clé représentant un homme. La partie droite est 是 (être). Ça semble désigner un mouvement lent d'après baidu.

Il a aussi son pendant feminin 媞 (femme + être) qui semble lié à la ruse ou à la tromperie (souvent un sens associé aux caractères liés aux femmes dans la chine ancienne
:zahi:
).
il y a 4 mois
C'est quelque chose que je me refuse normalement à faire mais ton message couplé à ma frustration m'a convaincu:
Image Image
ChatGPT suggère un bug dû à une ressemblance visuelle entre les idéogrammes 偍 et 卍. Je ne sais pas comment fonctionnent ces programmes mais j'ai vraiment du mal à concevoir comment un algorithme pourrait les confondre: pas le même nombre de traits, constructions différentes, sens littéraux très distincts,... Le seul argument qui pourrait potentiellement me faire pencher vers cette hypothèse c'est la relative proximité entre les 2 idéogrammes dans la table Unicode. Mais pourquoi ce caractère là en particulier (il y en a d'autres plus proches)? Et pourquoi un tel bug n'aurait jamais été rapporté? C'est pas convaincant du tout.
:aie:


ChatGPT nous dit aussi que c'est sans doute un bug machine, que ce n'est pas un humain derrière cette étrange traduction. Encore une fois, j'ai du mal à y croire compte tenu du poids et de la portée idéologique que se trimballe 卍...

bref, me voilà pas plus avancé
:tiz:
il y a 4 mois
C'est gentil
:tiz:


utilise-le autant que tu le souhaites
:coolent:
il y a 4 mois
baby
baby
4 mois
Il y a de ça quelques semaines, je m'amusais à parcourir l'immense liste des caractères unicode (autisme) et, en épluchant une des sections dédiées aux sinogrammes (0x5000 à 0x5FFF), je suis tombé sur ce caractère là: 偍 (0x504D)

À priori tout à fait banal, 偍 cache en fait quelque chose d'assez étrange: si vous essayez de le traduire via l'intégration Google Translate à la page de résultats, vous obtiendrez un swatiska en output, peu importe la langue que vous choisissez. Pas le mot "swastika" mais bel et bien le symbole 卍 comme vous pouvez le voir ici:
Image
À noter que 偍 n'est traduit de la sorte que sur la page de résultats. Si on se rend sur translate.google.com, le traducteur ne nous donne tout simplement pas de résultats comme pour les autres idéogrammes dont il ne connaît pas la traduction:
Image
Parmi tout ceux que j'ai pu testé, c'est le seul caractère qui présente cette particularité. Par exemple, ses 2 voisins dans la table unicode (0x504C et 0x504E) possèdent eux des traductions banales au possible:
Image Image
... et c'est normal puisqu'il s'agit ici des "premiers" sinogrammes répertoriés et qui sont supposés assez communément utilisés. (d'autres idéogrammes chinois, japonais et coréens plus littéraires et rares apparaissent bien plus tard dans la liste et ont même des plans dédiés, un plan contenant jusqu'à 65 534 caractères).

VOILÀ. Je peine à trouver une explication à cette bizarrerie malgré mes efforts. Aucune mention ailleurs sur internet à ma connaissance. J'ai demandé à un ami à moi qui étudie l'informatique et qui l'a lui même partagé à ses collègues mais pas d'update.

Je me tourne donc vers vous, d'abord parce que j'aime ce petit mystère et que je voulais vous en faire part, mais aussi et surtout dans l'espoir de déboucher sur d'éventuelles pistes!
:catent:
cadeau Image
Maybe I just want to maybe...
il y a 4 mois
Je connais pas du tout ce caractère mais je peux te dire que la partie gauche est une clé représentant un homme. La partie droite est 是 (être). Ça semble désigner un mouvement lent d'après baidu.

Il a aussi son pendant feminin 媞 (femme + être) qui semble lié à la ruse ou à la tromperie (souvent un sens associé aux caractères liés aux femmes dans la chine ancienne
:zahi:
).
pour le deuxième : Image
Maybe I just want to maybe...
il y a 4 mois
:teddivoyeur:
il y a 4 mois
j'ai continué à pas mal discuter avec lui mais les bugs les plus proches qui ont été rapportés mentionnent plutôt des bugs d'affichages avec des caractères invalides (les fameux "rectangles") ou des textes corrompus qui évoquent plutôt des soucis d'encodage. Les substitutions d'idéogrammes sont à priori assez rares et aucun cas avec un Swastika n'a été rapporté.... Le mystère s’épaissit.
:aie:


Je lui ai aussi fait part de mes tests et, selon lui, l'hypothèse la plus probable serrait un bug dans le pipeline de traduction / affichage de Google dans certains contextes.. À nouveau, compte tenu de la portée idéologique du 卍, je trouve cette conclusion peu satisfaisante
:bong:
il y a 4 mois
Lysaelia
Lysaelia
4 mois
cadeau Image
C'est gentil mais c'est pas vraiment le sens de l'idéogramme qui me questionne. Tu as lu le topic en entier?
:coolent:
il y a 4 mois
Lysaelia
Lysaelia
4 mois
pour le deuxième : Image
Ce topax m'a motivé pour faire celui-ci

onche.org https://onche.org/topic/9[...]ue-chinoise-et-les-femmes

:Invoc:
il y a 4 mois
Ahi ce khey d'exception qui a trouvé la faille dans le cosmos
:zahi:


En vrai je crois que google trad utilise une tonne de sources (bibliographiques et internet entre autres) pour la traduction, peut-être que ce terme est très rarement employé, et que pour le seul/l'un des seul cas 偍 = 卍
:AnimeFace13:


Peut-être aussi que c'est un petit malin qui a traduit ce terme ainsi plein de fois sur des pages de sources
:risibo:
Si jamais vous vous demandez d'où vient mon badge golem : Image
il y a 4 mois
Je connais pas du tout ce caractère mais je peux te dire que la partie gauche est une clé représentant un homme. La partie droite est 是 (être). Ça semble désigner un mouvement lent d'après baidu.

Il a aussi son pendant feminin 媞 (femme + être) qui semble lié à la ruse ou à la tromperie (souvent un sens associé aux caractères liés aux femmes dans la chine ancienne
:zahi:
).
Merci pour le partage, c'est intéressant! Je trouve aussi fascinant à quel point l'écriture même de ces caractères racontent une histoire
:catent:
il y a 4 mois
0-0
0-0
4 mois
Ahi ce khey d'exception qui a trouvé la faille dans le cosmos
:zahi:


En vrai je crois que google trad utilise une tonne de sources (bibliographiques et internet entre autres) pour la traduction, peut-être que ce terme est très rarement employé, et que pour le seul/l'un des seul cas 偍 = 卍
:AnimeFace13:


Peut-être aussi que c'est un petit malin qui a traduit ce terme ainsi plein de fois sur des pages de sources
:risibo:
Ton post me motive à comprendre comment Google Traduction traduit les sinogrammes!

Je vous ferrai part de mes trouvailles bien sûr (en espérant qu'il y en ait)
:coolent:
il y a 4 mois