Chat GPT like GRATUIT a VIE sur Onche, votre espace de liberté

Morios

MUGIWARA

3 ans

Je vais bientôt m'acheter des 16x4 de ram, j'en avais besoin justement. Du coup c'est une IA non connecté à internet ?

Les requêtes sont effectués sur ton pc mais l'IA va sur internet

il y a 3 ans

Morios

Non, c'est un model qui utilise le CPU

il y a 3 ans

Gelano

comment on utilise ça ?

il y a 3 ans

Morios

Je fais ça demain mp si j'ai oublié

il y a 3 ans

Sc2Go1

Bon finalement j'ai pas réussi à le faire fonctionner, erreur de nccl, jl'ai pourtant installé via les repos d'Archlinux puis testé en téléchargeant directement sur le site de NVIDIA puis via conda.

Puis j'ai trouvé ce repo qui propose la même chose mais avec une Interface web à la CHATGPT, le frontend est fait via SvelteKit et l'API via fastapi, mais bon osef si vous voulez pas toucher au code.

https://www.google.com/ur[...]Vaw2rDV8f1gz6bwTUgH0yUk6W

Suffit d'installer docker et docker-compose et suivre les instructions, (sous Linux en tout cas), on peut directement DL le 7B/30B dessus en le passant comme parameter.

C'est un peu lent mais ça fonctionne de mon côté, je viens de le faire fonctionner donc je peux pas vous dire ça donne quoi pour l'instant

il y a 3 ans

Sc2Go1

Je sais pas si ça DL exactement les mêmes models mais probablement, tu peux tester maintenant, le 7B met quelques minutes à DL

il y a 3 ans

Sc2Go1

4.5GB libres pour le 7B
12 pour le 13B
20 pour le 30B

D'après le README du repo

Mais c'est le CPU qui souffle

il y a 3 ans

Sc2Go1

Pas de soucis, ça annonce du bon pour la suite en tout cas

Si on pouvait se louer une machine de guerre à plusieurs et déployer le 30B voir au dessus ça ce serait cool

Le 7B a l'air bien con en tout cas

il y a 3 ans

Sc2Go1

Je viens de louer la machine la plus puissante avec shared CPU sur Hetzner et malgré ça c'est encore super lent même avec le 7B

Je vais tester quelques minutes avec une machine avec dedicated CPU à +500€ par mois pour voir, 48 vCPU 192GB de RAM

Edit : ils ont plus de disponibilité pour le moment dommage

Édit 2 : Testé avec le 7B et 30 B sur une machine à+1000€ par mois (48vcpu 96gb de RAM) sur Digital Ocean et ça met plusieurs minutes à donner une réponse basique, sûrement un problème au niveau du code sinon je vois pas comment ce serait utilisable, à rechecker dans quelques semaines

il y a 3 ans

Morios

Sc2Go1

3 ans

Bon finalement j'ai pas réussi à le faire fonctionner, erreur de nccl, jl'ai pourtant installé via les repos d'Archlinux puis testé en téléchargeant directement sur le site de NVIDIA puis via conda.

Puis j'ai trouvé ce repo qui propose la même chose mais avec une Interface web à la CHATGPT, le frontend est fait via SvelteKit et l'API via fastapi, mais bon osef si vous voulez pas toucher au code.

https://www.google.com/ur[...]Vaw2rDV8f1gz6bwTUgH0yUk6W

Suffit d'installer docker et docker-compose et suivre les instructions, (sous Linux en tout cas), on peut directement DL le 7B/30B dessus en le passant comme parameter.

C'est un peu lent mais ça fonctionne de mon côté, je viens de le faire fonctionner donc je peux pas vous dire ça donne quoi pour l'instant

cimer j'ai ajouter au premier message

il y a 3 ans

Morios

Sc2Go1

3 ans

Je viens de louer la machine la plus puissante avec shared CPU sur Hetzner et malgré ça c'est encore super lent même avec le 7B

Je vais tester quelques minutes avec une machine avec dedicated CPU à +500€ par mois pour voir, 48 vCPU 192GB de RAM

Edit : ils ont plus de disponibilité pour le moment dommage

Édit 2 : Testé avec le 7B et 30 B sur une machine à+1000€ par mois (48vcpu 96gb de RAM) sur Digital Ocean et ça met plusieurs minutes à donner une réponse basique, sûrement un problème au niveau du code sinon je vois pas comment ce serait utilisable, à rechecker dans quelques semaines

étrange dans une vidéo le mec l'avait utiliser sur un bête MAC

il y a 3 ans

Sc2Go1

Morios

3 ans

étrange dans une vidéo le mec l'avait utiliser sur un bête MAC

Pourtant d'après les issues ils ont tous des problèmes sur MAC + aucun mac n'est aussi puissant que les machines sur lesquels je viens de tester, peut être un problème avec ce qui a été implémenté sur ce repo là en particulier

Je testerai avec le repo officiel + cli sur une grosse machine ce soir

il y a 3 ans