InscriptionConnexion
Florentin
Florentin
9 mois
Pour la 5090 laptop je pensais qu'ils mettaient des puces plus puissantes et donc plus chères pour compenser la perte de perf par miniaturisation, parce que les laptop sont en general plus cher que du fixe
:risifi:

Pour le reste j'ai regarder et c'est vraiment le bordel quand tu commences de zéro
:rien_de_graf:

T'aurais un lien qui donne des tuto pour apprendre un peu en détail ? Je vais essayer le model 6K_Q pour 10GB sur ton dernier lien. Mais je sais pas si le modèle à 10GB ça veut dire pour 10Go de VRAM ? Parce que c'est Go et non GB les mesures sont différentes non ?

J'ai une rtx4070 12g, 32g RAM et 14500 intel. C'est pas une fusée mais ça fait le taff
:Jean_Heineken:

Les séries 50xx Super ont été annoncées en fin d'année et elles auront plus de VRAM. Alors ça promet pour la série 60xx, je pense m'en prendre une quand ça sortir dans 1 ans+
En fait, les cartes laptop sont moins puissante surtout une raison de refroidissement et de consommation d’énergie.

Oui, c'est complexe quand tu commence, mais tu apprends vite après (hésite pas à demander des conseils à chatGPT qui m'a bien aidé aussi).

Quand tu utilise du GGUF, la taille du modèle c'est la conso VRAM, mais il faut prendre en compte les tokens et l'appli en elle-même.
Du coup, je te conseil de faire "taille du modèle" + 2,5 Go de VRAM de marge.
Après dans text-generation-webui, il te fait l'estimation de ta conso, donc au début, test sur un petit modèle pour jauger la conso.

Si besoin d'info, hésite pas.
Mon propos est imaginaire et fictif, il n'implique donc aucun fait ou élément réel et toute ressemblance serait fortuite
il y a 9 mois