InscriptionConnexion
Il y a de ça quelques semaines, je m'amusais à parcourir l'immense liste des caractères unicode (autisme) et, en épluchant une des sections dédiées aux sinogrammes (0x5000 à 0x5FFF), je suis tombé sur ce caractère là: 偍 (0x504D)

À priori tout à fait banal, 偍 cache en fait quelque chose d'assez étrange: si vous essayez de le traduire via l'intégration Google Translate à la page de résultats, vous obtiendrez un swatiska en output, peu importe la langue que vous choisissez. Pas le mot "swastika" mais bel et bien le symbole 卍 comme vous pouvez le voir ici:
Image
À noter que 偍 n'est traduit de la sorte que sur la page de résultats. Si on se rend sur translate.google.com, le traducteur ne nous donne tout simplement pas de résultats comme pour les autres idéogrammes dont il ne connaît pas la traduction:
Image
Parmi tout ceux que j'ai pu testé, c'est le seul caractère qui présente cette particularité. Par exemple, ses 2 voisins dans la table unicode (0x504C et 0x504E) possèdent eux des traductions banales au possible:
Image Image
... et c'est normal puisqu'il s'agit ici des "premiers" sinogrammes répertoriés et qui sont supposés assez communément utilisés. (d'autres idéogrammes chinois, japonais et coréens plus littéraires et rares apparaissent bien plus tard dans la liste et ont même des plans dédiés, un plan contenant jusqu'à 65 534 caractères).

VOILÀ. Je peine à trouver une explication à cette bizarrerie malgré mes efforts. Aucune mention ailleurs sur internet à ma connaissance. J'ai demandé à un ami à moi qui étudie l'informatique et qui l'a lui même partagé à ses collègues mais pas d'update.

Je me tourne donc vers vous, d'abord parce que j'aime ce petit mystère et que je voulais vous en faire part, mais aussi et surtout dans l'espoir de déboucher sur d'éventuelles pistes!
:catent:
il y a 25 jours
:Hitler_aime:
In vino veritas
il y a 25 jours
Nos chômeurs ont dû talent
:lebossgraisse:
il y a 25 jours
Je croyais être un peu autiste, merci l'op de me faire relativiser
:risitas_gonfle:
il y a 25 jours
:Nazi_lit:
¡Esta serpiente marina MATÓ a un Celestino! https://streamable.com/fmjgjb
il y a 25 jours
C'est bien sûr la première chose que j'ai faite, mais aucune réponse sur reddit ou google!
Peut-être que je cherche mal, avoir "swastika" et "google translate" en mots clés n'aide pas du tout à trouver des résultats pertinents
:aie:

Si toi ou d'autres kheyonches avez des techniques plus efficaces pour faire de genre de recherche, je suis preneur!
il y a 25 jours
Le troll d un dev chinois
:je_sais_pas:
Il y a deux façons de se tromper : L'une est de croire ce qui n'est pas, L'autre de refuser de croire ce qui est
il y a 25 jours
Attends première phrase je hurle de rire déjà
:zahi:
il y a 25 jours
Je connais pas du tout ce caractère mais je peux te dire que la partie gauche est une clé représentant un homme. La partie droite est 是 (être). Ça semble désigner un mouvement lent d'après baidu.

Il a aussi son pendant feminin 媞 (femme + être) qui semble lié à la ruse ou à la tromperie (souvent un sens associé aux caractères liés aux femmes dans la chine ancienne
:zahi:
).
il y a 25 jours
C'est quelque chose que je me refuse normalement à faire mais ton message couplé à ma frustration m'a convaincu:
Image Image
ChatGPT suggère un bug dû à une ressemblance visuelle entre les idéogrammes 偍 et 卍. Je ne sais pas comment fonctionnent ces programmes mais j'ai vraiment du mal à concevoir comment un algorithme pourrait les confondre: pas le même nombre de traits, constructions différentes, sens littéraux très distincts,... Le seul argument qui pourrait potentiellement me faire pencher vers cette hypothèse c'est la relative proximité entre les 2 idéogrammes dans la table Unicode. Mais pourquoi ce caractère là en particulier (il y en a d'autres plus proches)? Et pourquoi un tel bug n'aurait jamais été rapporté? C'est pas convaincant du tout.
:aie:


ChatGPT nous dit aussi que c'est sans doute un bug machine, que ce n'est pas un humain derrière cette étrange traduction. Encore une fois, j'ai du mal à y croire compte tenu du poids et de la portée idéologique que se trimballe 卍...

bref, me voilà pas plus avancé
:tiz:
il y a 25 jours
C'est gentil
:tiz:


utilise-le autant que tu le souhaites
:coolent:
il y a 25 jours
baby
baby
25j
Il y a de ça quelques semaines, je m'amusais à parcourir l'immense liste des caractères unicode (autisme) et, en épluchant une des sections dédiées aux sinogrammes (0x5000 à 0x5FFF), je suis tombé sur ce caractère là: 偍 (0x504D)

À priori tout à fait banal, 偍 cache en fait quelque chose d'assez étrange: si vous essayez de le traduire via l'intégration Google Translate à la page de résultats, vous obtiendrez un swatiska en output, peu importe la langue que vous choisissez. Pas le mot "swastika" mais bel et bien le symbole 卍 comme vous pouvez le voir ici:
Image
À noter que 偍 n'est traduit de la sorte que sur la page de résultats. Si on se rend sur translate.google.com, le traducteur ne nous donne tout simplement pas de résultats comme pour les autres idéogrammes dont il ne connaît pas la traduction:
Image
Parmi tout ceux que j'ai pu testé, c'est le seul caractère qui présente cette particularité. Par exemple, ses 2 voisins dans la table unicode (0x504C et 0x504E) possèdent eux des traductions banales au possible:
Image Image
... et c'est normal puisqu'il s'agit ici des "premiers" sinogrammes répertoriés et qui sont supposés assez communément utilisés. (d'autres idéogrammes chinois, japonais et coréens plus littéraires et rares apparaissent bien plus tard dans la liste et ont même des plans dédiés, un plan contenant jusqu'à 65 534 caractères).

VOILÀ. Je peine à trouver une explication à cette bizarrerie malgré mes efforts. Aucune mention ailleurs sur internet à ma connaissance. J'ai demandé à un ami à moi qui étudie l'informatique et qui l'a lui même partagé à ses collègues mais pas d'update.

Je me tourne donc vers vous, d'abord parce que j'aime ce petit mystère et que je voulais vous en faire part, mais aussi et surtout dans l'espoir de déboucher sur d'éventuelles pistes!
:catent:
cadeau Image
Maybe I just want to maybe...
il y a 25 jours
Je connais pas du tout ce caractère mais je peux te dire que la partie gauche est une clé représentant un homme. La partie droite est 是 (être). Ça semble désigner un mouvement lent d'après baidu.

Il a aussi son pendant feminin 媞 (femme + être) qui semble lié à la ruse ou à la tromperie (souvent un sens associé aux caractères liés aux femmes dans la chine ancienne
:zahi:
).
pour le deuxième : Image
Maybe I just want to maybe...
il y a 25 jours
:teddivoyeur:
il y a 25 jours
j'ai continué à pas mal discuter avec lui mais les bugs les plus proches qui ont été rapportés mentionnent plutôt des bugs d'affichages avec des caractères invalides (les fameux "rectangles") ou des textes corrompus qui évoquent plutôt des soucis d'encodage. Les substitutions d'idéogrammes sont à priori assez rares et aucun cas avec un Swastika n'a été rapporté.... Le mystère s’épaissit.
:aie:


Je lui ai aussi fait part de mes tests et, selon lui, l'hypothèse la plus probable serrait un bug dans le pipeline de traduction / affichage de Google dans certains contextes.. À nouveau, compte tenu de la portée idéologique du 卍, je trouve cette conclusion peu satisfaisante
:bong:
il y a 25 jours
cadeau Image
C'est gentil mais c'est pas vraiment le sens de l'idéogramme qui me questionne. Tu as lu le topic en entier?
:coolent:
il y a 25 jours
pour le deuxième : Image
Ce topax m'a motivé pour faire celui-ci

onche.org https://onche.org/topic/9[...]ue-chinoise-et-les-femmes

:Invoc:
il y a 25 jours
Ahi ce khey d'exception qui a trouvé la faille dans le cosmos
:zahi:


En vrai je crois que google trad utilise une tonne de sources (bibliographiques et internet entre autres) pour la traduction, peut-être que ce terme est très rarement employé, et que pour le seul/l'un des seul cas 偍 = 卍
:AnimeFace13:


Peut-être aussi que c'est un petit malin qui a traduit ce terme ainsi plein de fois sur des pages de sources
:risibo:
Si jamais vous vous demandez d'où vient mon badge golem : Image
il y a 25 jours
Je connais pas du tout ce caractère mais je peux te dire que la partie gauche est une clé représentant un homme. La partie droite est 是 (être). Ça semble désigner un mouvement lent d'après baidu.

Il a aussi son pendant feminin 媞 (femme + être) qui semble lié à la ruse ou à la tromperie (souvent un sens associé aux caractères liés aux femmes dans la chine ancienne
:zahi:
).
Merci pour le partage, c'est intéressant! Je trouve aussi fascinant à quel point l'écriture même de ces caractères racontent une histoire
:catent:
il y a 25 jours
0-0
0-0
25j
Ahi ce khey d'exception qui a trouvé la faille dans le cosmos
:zahi:


En vrai je crois que google trad utilise une tonne de sources (bibliographiques et internet entre autres) pour la traduction, peut-être que ce terme est très rarement employé, et que pour le seul/l'un des seul cas 偍 = 卍
:AnimeFace13:


Peut-être aussi que c'est un petit malin qui a traduit ce terme ainsi plein de fois sur des pages de sources
:risibo:
Ton post me motive à comprendre comment Google Traduction traduit les sinogrammes!

Je vous ferrai part de mes trouvailles bien sûr (en espérant qu'il y en ait)
:coolent:
il y a 25 jours