InscriptionConnexion
SooTae11
SooTae11
6 mois
Masterclass, à tout moment webedia signe un deal avec vous donc faites en sorte que ça glisse pas trop aya
Ca m'étonnerai, j'ai fait un topic dessus jme suis manger 30 jours de ban aya.
Et il sera pas modérer, donc le modèle glissera à 100%

Pour rappel, le seul modèle au monde à être bannis, c'est gpt-4chan : huggingface.co https://huggingface.co/ykilcher/gpt-4chan

Du coup il pourrait très bien nous arriver la même chose
:zahi:
il y a 6 mois
Ahi cimer, puis ca t'évite de dépenser des sous
:Mouais_Jesus:


Le model a été mis à jour sinon, 40% de 2024 train dessus, de plus le contexte à l'air d'être vachement agrandi avant de boucler.
Voici un test de topic ou on l'a poussé à parler longtemps, on aurai pu continuer mais voilà.
Il est resté "cohérent" entre guillemet ahi
:risitas_ahi:


il y a 6 mois
Si le bot le fait ecrire typiquement comme ça c'est que ca devait pas être un écrivain
:ding:


Pour le reste, je train sur Llama 3.1 8B BASE, il est pas vraiment train à parler français, donc il apprend pas vraiment le "français", mais le "kheyou" ahi.

Et oui, c'est bien le bot qui intéragi avec lui même ahi
il y a 6 mois
Le dataset qu'on utilise contient 20% des données utilisable pour nous de JVArchive (tout les topic sous 130 000 tokens), => tout les topics de 2024 (01-2024 - 12-2024)
il y a 6 mois
Perso y a 6 mois j'avais DL les backup moi-même et j'ai vu que tout était lié par ID et tout, j'ai dit "non, nope".
:risitas_ahi:


Puis je suis tombé sur Greums qui lui s'y connait et c'est à lui qu'il faut demandé ça ahi.
Je lui ai posé ta question
il y a 6 mois
Essaye sur des petits modèles de la même famille d'abord
Le dataset est le truc le plus important
Je passe ma vie sur les graph wandb (je bosse dans l'IA à côté ahi), c'est important de regarder les graph et les comprendre
Faire des full finetune si t'as la thune
il y a 6 mois
L'élite
:aahi:


Se sert de l'IA pour créer un faux forum et vivre comme un khey lambda sur le forum, mais dans un forum généré par IA
:aahi:
il y a 6 mois
Il a dit "J'ai fait mon propre parseur à la main, c'était chiant pour les citations imbriquées"
:ding:
il y a 6 mois
L'élite
:aahi:


Se sert de l'IA pour créer un faux forum et vivre comme un khey lambda sur le forum, mais dans un forum généré par IA
:aahi:
il y a 6 mois
On a atteint les 45% de train, voici un exemple ou le bot doit gérer beaucoup de citation, on a rien touché
il y a 6 mois
Un de mes secondaire est apparu dans les logs de test (et un pseudo d'un pote)
:ding:

Je voulais vous le montrer mais j'ai trop honte de ce que j'ai posté
:risitas_ahi:


Si un autre de mes secondaires plus sains sors je screen ahi
il y a 6 mois
Je fav
:risitas_ahi:
il y a 6 mois
Bonjour.
L'heure est grave
:mort:


Je me suis levé 10 minute trop tard, j'étais à -0.15$ sur vast.ai
:risitas_ahi:


Mais du coup mon train s'est coupé à 55%, je l'ai relancé là après avoir attendu de récupérer ma machine, j'espère que ca bousillera pas le modèle, le train est reparti
:Mouais_Jesus:


Il a repris ou il était, j'upload la dernière MaJ : 55% de 2024.
On verra si le modèle suis, jsuis deg bordel ayaooo

:pnl_paz:
il y a 6 mois
il y a 6 mois
Undi
Undi
6 mois
Plus vrai que nature
:risimortdelol:
:jeanmariepirate:
1928–2025
:jeanmariepirate:
il y a 6 mois