Ce sujet a été résolu
Deep Seek : incapable de créer des images.
Dream studio :
Grok :
Stable Diffusion : Payant sans pouvoir tester.
Huggingface :
ChatGPT :
Sora ( C'est ChatGPT si j'ai bien compris ) :
Le prompt : J'aimerais que tu me génère une image de Minato Namikaze. Celà doit être une carte de la gamme Naruto Kayou, avec pas mal d'effets holographiques bien stylés. Minato, lui, tape une pose avec un Rasengan dans la main et un de ses fameux kunai de téléportation dans l'autre.
Bordel, je ne m'attendais pas à une claque aussi violente de la part de ChatGPT sur absolument tous ses concurrents. Je songe sérieusement à prendre un abonnement.
Dream studio :
Grok :
Stable Diffusion : Payant sans pouvoir tester.
Huggingface :
ChatGPT :
Sora ( C'est ChatGPT si j'ai bien compris ) :
Le prompt : J'aimerais que tu me génère une image de Minato Namikaze. Celà doit être une carte de la gamme Naruto Kayou, avec pas mal d'effets holographiques bien stylés. Minato, lui, tape une pose avec un Rasengan dans la main et un de ses fameux kunai de téléportation dans l'autre.
Bordel, je ne m'attendais pas à une claque aussi violente de la part de ChatGPT sur absolument tous ses concurrents. Je songe sérieusement à prendre un abonnement.
il y a un an
non grok est absolument largué la
Ils ont tués lagaf, comment les pardonner ?
il y a un an
Oui, Grok arrive en deuxième place c'est vrai, il a compris 2-3 choses mais c'est trompé de personnage et ne m'a pas crée une carte, et aucun effet holographique n'est présent. Va falloir qu'ils améliorent grandement leur système si ils veulent tenir la route sur le long terme parcequ'en terme de compréhension,.ChatGPT leur met une soufflante magistrale.
Pour les autres, no comment.
Deep Seek,.j'attend de voir.
Pour les autres, no comment.
Deep Seek,.j'attend de voir.
il y a un an
Minato
1 an
Deep Seek : incapable de créer des images.
Dream studio :
Grok :
Stable Diffusion : Payant sans pouvoir tester.
Huggingface :
ChatGPT :
Sora ( C'est ChatGPT si j'ai bien compris ) :
Le prompt : J'aimerais que tu me génère une image de Minato Namikaze. Celà doit être une carte de la gamme Naruto Kayou, avec pas mal d'effets holographiques bien stylés. Minato, lui, tape une pose avec un Rasengan dans la main et un de ses fameux kunai de téléportation dans l'autre.
Bordel, je ne m'attendais pas à une claque aussi violente de la part de ChatGPT sur absolument tous ses concurrents. Je songe sérieusement à prendre un abonnement.
Dream studio :
Grok :
Stable Diffusion : Payant sans pouvoir tester.
Huggingface :
ChatGPT :
Sora ( C'est ChatGPT si j'ai bien compris ) :
Le prompt : J'aimerais que tu me génère une image de Minato Namikaze. Celà doit être une carte de la gamme Naruto Kayou, avec pas mal d'effets holographiques bien stylés. Minato, lui, tape une pose avec un Rasengan dans la main et un de ses fameux kunai de téléportation dans l'autre.
Bordel, je ne m'attendais pas à une claque aussi violente de la part de ChatGPT sur absolument tous ses concurrents. Je songe sérieusement à prendre un abonnement.
il y a un an
C'est pas un prompt ça.
GPT l'a réinterprété ce que n'ont pas su faire les autres.
GPT l'a réinterprété ce que n'ont pas su faire les autres.
il y a un an
Stable Diffusion : Payant sans pouvoir tester.
Stable diffusion c'est un modèle local khey, c'est le seul qui est gratuit et le restera toujours, même une fois l'inévitable enshitification des autres.
C'est aussi le seul qui te laisse un réel contrôle sur ton prompt, en choisissant non seulement le modèle, mais aussi l'algorithme de diffusion, et divers paramètres tels que le nombre de steps ou la déviation par rapport à ton prompte.
il y a un an
MacronSkywalker
1 an
Stable Diffusion : Payant sans pouvoir tester.
Stable diffusion c'est un modèle local khey, c'est le seul qui est gratuit et le restera toujours, même une fois l'inévitable enshitification des autres.
C'est aussi le seul qui te laisse un réel contrôle sur ton prompt, en choisissant non seulement le modèle, mais aussi l'algorithme de diffusion, et divers paramètres tels que le nombre de steps ou la déviation par rapport à ton prompte.
Pour te donner une idée, Stable Diffusion en local ça ressemble à ça :
Comme c'est infâme et inutilisable en lignes de commandes, j'utilise une librairie graphique qui s'appelle Gradio,
Comme c'est un modèle plus graphique et moins LLM qu'un ChatGPT, faut aussi adapter le prompt spécifiquement, j'ai tenté celui-ci :
Pour te donner une idée de la granularité du truc, ici sur une seed au hasard, j'ai lancé avec 2 paramètres variables : le nombre d'itérations croissant, et la variance par rapport au prompt décroissante. C'est à dire que plus on est à gauche, plus l'image est rapide à générer (la vitesse se paie en manque de qualité), plus on est en haut, plus elle est fidèle au prompt (la fidélité peut se payer en cohérence ou en harmonie). et j'obtiens les résultats suivants :
Alors certes, les résultats sont loin d'être ceux que tu attends, mais ça vient plus de mon propre manque de motivation : pour avoir un résultat parfait, il faut installer les bons LoRa naruto et/ou trading cards, itérer sur un grand nombre de seeds avec une grande rapidité, quand tu obtiens une seed qui te convient tu fais une matrix avec plusieurs paramètres comme je t'ai montré, puis quand tu as une image qui te convient tu fais de l'inpainting pour gommer les dernières imperfections.
Le process de recherche de Seed tu le fais aussi sur ChatGPT, il te file souvent plusieurs images et tu choisis celle que tu veux, par exemple ici j'en génère 5 sur des seeds aléatoires :
Beaucoup de résultats peu fidèles, et je trouve les résultats trop glossy, je les veux plus animés, alors... bah merde je dois chercher un Lora, genre celui là, que je télécharge :
https://civitai.com/model[...]5476/naruto-or-style-lora, et que je colle dans mon dossier stable-diffusion-webui\models\Lora, et puis je relance une recherche de seed aléatoires :
Je trouve les résultats mieux en terme de Naruto, qui que c'est toujours que Naruto et Sasuke, donc belotte :
https://civitai.com/model[...]namikaze-naruto-shippuden. Aussi, c'est pas très "trading card", donc rebelotte :
https://civitai.com/models/741650/trading-card (et en fait non ça marche pas ce Lora et je sais pas pourquoi mais flemme de chercher en détail ):
Je trouve que cette horreur pourrait à peu près faire l'affaire, en dépit du REFUS de faire minato putain :
Donc je l'envoie en img-2-img, c'est à dire qu'à partir de maintenant je n'itère plus à partir de rien, mais à partir de cette image. Le process change assez peu : on recherche une seed où ça un peu de gueule, et aussi on itère par rapport à la photo, c'est à dire qu'on conserve cette image dans la bruit. Ici, j'ai fait une recherche où plus on est à gauche, moins l'image est conservée (ici de 33% à 88%) et donc plus elle sera fidèle à l'originale :
A force d'itérations, je devrais arriver à un résultat un poil plus convenable. Là, mon résultat est à comparer avec ce qu'on pouvait faire sur ChatGPT il y a environ 8 mois, quand j'ai installé mon modèle, parce que j'avoue ne plus du tout utiliser Stable Diffusion vu la TANNE que c'est pour un résultat plutôt médiocre si je n'y mets pas le temps.
Bref, je n'arrive pas au résultat que tu as avec ChatGPT, même en y mettant du temps et des efforts, mais je pense que pour un truc qui tourne en local sur mon PC plutôt que sur des serveurs qui coûtent des millions par jour à des investisseurs américains et qu'il faudra un jour rentabilisé, je m'en sors pas si mal
D'autant que ce que je perds en commodité, il faut tout de même souligner que je le gagne en liberté : là où ChatGPT est un assistant, Stable Diffusion est un outil complet qui te donne beaucoup, beaucoup plus de liberté.
Ah oui, aussi, vu que c'est pas détenu par des puritains américains mais que ça tourne localement sur mon PC, je peux faire du NSFW ou des images politiques.
Comme c'est infâme et inutilisable en lignes de commandes, j'utilise une librairie graphique qui s'appelle Gradio,
Comme c'est un modèle plus graphique et moins LLM qu'un ChatGPT, faut aussi adapter le prompt spécifiquement, j'ai tenté celui-ci :
SD prompt
Minato Namikaze, Naruto Kayou trading card style, vibrant holographic effects, dynamic pose, Rasengan in hand, teleportation kunai in other hand, sleek design, visually impressive, detailed background, high contrast, cinematic lighting, intricate details, anime aesthetic, bold colors, sharp focus, dramatic shadows, futuristic elements, glowing aura, action-packed, iconic Naruto character, epic scene, professional illustration.
Pour te donner une idée de la granularité du truc, ici sur une seed au hasard, j'ai lancé avec 2 paramètres variables : le nombre d'itérations croissant, et la variance par rapport au prompt décroissante. C'est à dire que plus on est à gauche, plus l'image est rapide à générer (la vitesse se paie en manque de qualité), plus on est en haut, plus elle est fidèle au prompt (la fidélité peut se payer en cohérence ou en harmonie). et j'obtiens les résultats suivants :
Alors certes, les résultats sont loin d'être ceux que tu attends, mais ça vient plus de mon propre manque de motivation : pour avoir un résultat parfait, il faut installer les bons LoRa naruto et/ou trading cards, itérer sur un grand nombre de seeds avec une grande rapidité, quand tu obtiens une seed qui te convient tu fais une matrix avec plusieurs paramètres comme je t'ai montré, puis quand tu as une image qui te convient tu fais de l'inpainting pour gommer les dernières imperfections.
Le process de recherche de Seed tu le fais aussi sur ChatGPT, il te file souvent plusieurs images et tu choisis celle que tu veux, par exemple ici j'en génère 5 sur des seeds aléatoires :
Beaucoup de résultats peu fidèles, et je trouve les résultats trop glossy, je les veux plus animés, alors... bah merde je dois chercher un Lora, genre celui là, que je télécharge :
Je trouve les résultats mieux en terme de Naruto, qui que c'est toujours que Naruto et Sasuke, donc belotte :
Je trouve que cette horreur pourrait à peu près faire l'affaire, en dépit du REFUS de faire minato putain :
Donc je l'envoie en img-2-img, c'est à dire qu'à partir de maintenant je n'itère plus à partir de rien, mais à partir de cette image. Le process change assez peu : on recherche une seed où ça un peu de gueule, et aussi on itère par rapport à la photo, c'est à dire qu'on conserve cette image dans la bruit. Ici, j'ai fait une recherche où plus on est à gauche, moins l'image est conservée (ici de 33% à 88%) et donc plus elle sera fidèle à l'originale :
A force d'itérations, je devrais arriver à un résultat un poil plus convenable. Là, mon résultat est à comparer avec ce qu'on pouvait faire sur ChatGPT il y a environ 8 mois, quand j'ai installé mon modèle, parce que j'avoue ne plus du tout utiliser Stable Diffusion vu la TANNE que c'est pour un résultat plutôt médiocre si je n'y mets pas le temps.
Bref, je n'arrive pas au résultat que tu as avec ChatGPT, même en y mettant du temps et des efforts, mais je pense que pour un truc qui tourne en local sur mon PC plutôt que sur des serveurs qui coûtent des millions par jour à des investisseurs américains et qu'il faudra un jour rentabilisé, je m'en sors pas si mal
D'autant que ce que je perds en commodité, il faut tout de même souligner que je le gagne en liberté : là où ChatGPT est un assistant, Stable Diffusion est un outil complet qui te donne beaucoup, beaucoup plus de liberté.
Ah oui, aussi, vu que c'est pas détenu par des puritains américains mais que ça tourne localement sur mon PC, je peux faire du NSFW ou des images politiques.
il y a un an
Pour te donner une idée, Stable Diffusion en local ça ressemble à ça :
Comme c'est infâme et inutilisable en lignes de commandes, j'utilise une librairie graphique qui s'appelle Gradio,
Comme c'est un modèle plus graphique et moins LLM qu'un ChatGPT, faut aussi adapter le prompt spécifiquement, j'ai tenté celui-ci :
Pour te donner une idée de la granularité du truc, ici sur une seed au hasard, j'ai lancé avec 2 paramètres variables : le nombre d'itérations croissant, et la variance par rapport au prompt décroissante. C'est à dire que plus on est à gauche, plus l'image est rapide à générer (la vitesse se paie en manque de qualité), plus on est en haut, plus elle est fidèle au prompt (la fidélité peut se payer en cohérence ou en harmonie). et j'obtiens les résultats suivants :
Alors certes, les résultats sont loin d'être ceux que tu attends, mais ça vient plus de mon propre manque de motivation : pour avoir un résultat parfait, il faut installer les bons LoRa naruto et/ou trading cards, itérer sur un grand nombre de seeds avec une grande rapidité, quand tu obtiens une seed qui te convient tu fais une matrix avec plusieurs paramètres comme je t'ai montré, puis quand tu as une image qui te convient tu fais de l'inpainting pour gommer les dernières imperfections.
Le process de recherche de Seed tu le fais aussi sur ChatGPT, il te file souvent plusieurs images et tu choisis celle que tu veux, par exemple ici j'en génère 5 sur des seeds aléatoires :
Beaucoup de résultats peu fidèles, et je trouve les résultats trop glossy, je les veux plus animés, alors... bah merde je dois chercher un Lora, genre celui là, que je télécharge :
https://civitai.com/model[...]5476/naruto-or-style-lora, et que je colle dans mon dossier stable-diffusion-webui\models\Lora, et puis je relance une recherche de seed aléatoires :
Je trouve les résultats mieux en terme de Naruto, qui que c'est toujours que Naruto et Sasuke, donc belotte :
https://civitai.com/model[...]namikaze-naruto-shippuden. Aussi, c'est pas très "trading card", donc rebelotte :
https://civitai.com/models/741650/trading-card (et en fait non ça marche pas ce Lora et je sais pas pourquoi mais flemme de chercher en détail ):
Je trouve que cette horreur pourrait à peu près faire l'affaire, en dépit du REFUS de faire minato putain :
Donc je l'envoie en img-2-img, c'est à dire qu'à partir de maintenant je n'itère plus à partir de rien, mais à partir de cette image. Le process change assez peu : on recherche une seed où ça un peu de gueule, et aussi on itère par rapport à la photo, c'est à dire qu'on conserve cette image dans la bruit. Ici, j'ai fait une recherche où plus on est à gauche, moins l'image est conservée (ici de 33% à 88%) et donc plus elle sera fidèle à l'originale :
A force d'itérations, je devrais arriver à un résultat un poil plus convenable. Là, mon résultat est à comparer avec ce qu'on pouvait faire sur ChatGPT il y a environ 8 mois, quand j'ai installé mon modèle, parce que j'avoue ne plus du tout utiliser Stable Diffusion vu la TANNE que c'est pour un résultat plutôt médiocre si je n'y mets pas le temps.
Bref, je n'arrive pas au résultat que tu as avec ChatGPT, même en y mettant du temps et des efforts, mais je pense que pour un truc qui tourne en local sur mon PC plutôt que sur des serveurs qui coûtent des millions par jour à des investisseurs américains et qu'il faudra un jour rentabilisé, je m'en sors pas si mal
D'autant que ce que je perds en commodité, il faut tout de même souligner que je le gagne en liberté : là où ChatGPT est un assistant, Stable Diffusion est un outil complet qui te donne beaucoup, beaucoup plus de liberté.
Ah oui, aussi, vu que c'est pas détenu par des puritains américains mais que ça tourne localement sur mon PC, je peux faire du NSFW ou des images politiques.
Comme c'est infâme et inutilisable en lignes de commandes, j'utilise une librairie graphique qui s'appelle Gradio,
Comme c'est un modèle plus graphique et moins LLM qu'un ChatGPT, faut aussi adapter le prompt spécifiquement, j'ai tenté celui-ci :
SD prompt
Minato Namikaze, Naruto Kayou trading card style, vibrant holographic effects, dynamic pose, Rasengan in hand, teleportation kunai in other hand, sleek design, visually impressive, detailed background, high contrast, cinematic lighting, intricate details, anime aesthetic, bold colors, sharp focus, dramatic shadows, futuristic elements, glowing aura, action-packed, iconic Naruto character, epic scene, professional illustration.
Pour te donner une idée de la granularité du truc, ici sur une seed au hasard, j'ai lancé avec 2 paramètres variables : le nombre d'itérations croissant, et la variance par rapport au prompt décroissante. C'est à dire que plus on est à gauche, plus l'image est rapide à générer (la vitesse se paie en manque de qualité), plus on est en haut, plus elle est fidèle au prompt (la fidélité peut se payer en cohérence ou en harmonie). et j'obtiens les résultats suivants :
Alors certes, les résultats sont loin d'être ceux que tu attends, mais ça vient plus de mon propre manque de motivation : pour avoir un résultat parfait, il faut installer les bons LoRa naruto et/ou trading cards, itérer sur un grand nombre de seeds avec une grande rapidité, quand tu obtiens une seed qui te convient tu fais une matrix avec plusieurs paramètres comme je t'ai montré, puis quand tu as une image qui te convient tu fais de l'inpainting pour gommer les dernières imperfections.
Le process de recherche de Seed tu le fais aussi sur ChatGPT, il te file souvent plusieurs images et tu choisis celle que tu veux, par exemple ici j'en génère 5 sur des seeds aléatoires :
Beaucoup de résultats peu fidèles, et je trouve les résultats trop glossy, je les veux plus animés, alors... bah merde je dois chercher un Lora, genre celui là, que je télécharge :
Je trouve les résultats mieux en terme de Naruto, qui que c'est toujours que Naruto et Sasuke, donc belotte :
Je trouve que cette horreur pourrait à peu près faire l'affaire, en dépit du REFUS de faire minato putain :
Donc je l'envoie en img-2-img, c'est à dire qu'à partir de maintenant je n'itère plus à partir de rien, mais à partir de cette image. Le process change assez peu : on recherche une seed où ça un peu de gueule, et aussi on itère par rapport à la photo, c'est à dire qu'on conserve cette image dans la bruit. Ici, j'ai fait une recherche où plus on est à gauche, moins l'image est conservée (ici de 33% à 88%) et donc plus elle sera fidèle à l'originale :
A force d'itérations, je devrais arriver à un résultat un poil plus convenable. Là, mon résultat est à comparer avec ce qu'on pouvait faire sur ChatGPT il y a environ 8 mois, quand j'ai installé mon modèle, parce que j'avoue ne plus du tout utiliser Stable Diffusion vu la TANNE que c'est pour un résultat plutôt médiocre si je n'y mets pas le temps.
Bref, je n'arrive pas au résultat que tu as avec ChatGPT, même en y mettant du temps et des efforts, mais je pense que pour un truc qui tourne en local sur mon PC plutôt que sur des serveurs qui coûtent des millions par jour à des investisseurs américains et qu'il faudra un jour rentabilisé, je m'en sors pas si mal
D'autant que ce que je perds en commodité, il faut tout de même souligner que je le gagne en liberté : là où ChatGPT est un assistant, Stable Diffusion est un outil complet qui te donne beaucoup, beaucoup plus de liberté.
Ah oui, aussi, vu que c'est pas détenu par des puritains américains mais que ça tourne localement sur mon PC, je peux faire du NSFW ou des images politiques.
Et petit aparté sur le modèle des LLM actuels : il est absolument INCOMPREHENSIBLE pour moi que les IA gratuites laissent générer des images aux utilisateurs. Je n'imagine pas le coût d'une pareil opération, mais pour le tourner localement sur mon PC avec un RTX 3600 ( 8Gb
), je peux générer une image plutôt mauvaise qualité en 4 ou 5 secondes, et la résolution et format de ChatGPT en ... je ne sais même pas, probablement 2 ou 3 minutes.
Je sais que c'est pour gagner des parts de marchés, qu'on peut se permettre de cramer l'argent des investisseurs avec la promesse que "ChatGPT sera en 2030 ce que Google était en 2000, donc il ne faut pas rater en 2025 l'investissement qu'on aurait fait à Google en 1995"
MAIS putain quoi les gars quand vous générez 4 photos de vous en Ghibli dites vous bien qu'en terme de puissance vous demandez sans doute une dizaine de secondes de Cloud Gaming sur Cyberpunk complètement gratuitement.
Je sais que c'est pour gagner des parts de marchés, qu'on peut se permettre de cramer l'argent des investisseurs avec la promesse que "ChatGPT sera en 2030 ce que Google était en 2000, donc il ne faut pas rater en 2025 l'investissement qu'on aurait fait à Google en 1995"
MAIS putain quoi les gars quand vous générez 4 photos de vous en Ghibli dites vous bien qu'en terme de puissance vous demandez sans doute une dizaine de secondes de Cloud Gaming sur Cyberpunk complètement gratuitement.
il y a un an
Et petit aparté sur le modèle des LLM actuels : il est absolument INCOMPREHENSIBLE pour moi que les IA gratuites laissent générer des images aux utilisateurs. Je n'imagine pas le coût d'une pareil opération, mais pour le tourner localement sur mon PC avec un RTX 3600 ( 8Gb
), je peux générer une image plutôt mauvaise qualité en 4 ou 5 secondes, et la résolution et format de ChatGPT en ... je ne sais même pas, probablement 2 ou 3 minutes.
Je sais que c'est pour gagner des parts de marchés, qu'on peut se permettre de cramer l'argent des investisseurs avec la promesse que "ChatGPT sera en 2030 ce que Google était en 2000, donc il ne faut pas rater en 2025 l'investissement qu'on aurait fait à Google en 1995"
MAIS putain quoi les gars quand vous générez 4 photos de vous en Ghibli dites vous bien qu'en terme de puissance vous demandez sans doute une dizaine de secondes de Cloud Gaming sur Cyberpunk complètement gratuitement.
Je sais que c'est pour gagner des parts de marchés, qu'on peut se permettre de cramer l'argent des investisseurs avec la promesse que "ChatGPT sera en 2030 ce que Google était en 2000, donc il ne faut pas rater en 2025 l'investissement qu'on aurait fait à Google en 1995"
MAIS putain quoi les gars quand vous générez 4 photos de vous en Ghibli dites vous bien qu'en terme de puissance vous demandez sans doute une dizaine de secondes de Cloud Gaming sur Cyberpunk complètement gratuitement.
T’a qu’a payer si tu veux
Expat au 🇻🇳
il y a un an
T’a qu’a payer si tu veux
Ce n'est pas que je VEUX payer, je suis absolument heureux de générer des photos Ghiblis de ma petite famille pour les oublier 10 secondes plus tard, mais je dis juste que c'est MATERIELLEMENT impossible que ce service reste gratuit trop longtemps, et la théorie de l'enshitification, doctrinalement suivie par la Silicon Valley, poussera OpenAI à rendre son produit moins bien et plus cher sitôt la concurrence écrasée ou le status quo établi
il y a un an
Ce n'est pas que je VEUX payer, je suis absolument heureux de générer des photos Ghiblis de ma petite famille pour les oublier 10 secondes plus tard, mais je dis juste que c'est MATERIELLEMENT impossible que ce service reste gratuit trop longtemps, et la théorie de l'enshitification, doctrinalement suivie par la Silicon Valley, poussera OpenAI à rendre son produit moins bien et plus cher sitôt la concurrence écrasée ou le status quo établi
Te tracasse pas kheyou, profites en au maximum tant qu’il t’est permis de le faire
Expat au 🇻🇳
il y a un an
Ce n'est pas que je VEUX payer, je suis absolument heureux de générer des photos Ghiblis de ma petite famille pour les oublier 10 secondes plus tard, mais je dis juste que c'est MATERIELLEMENT impossible que ce service reste gratuit trop longtemps, et la théorie de l'enshitification, doctrinalement suivie par la Silicon Valley, poussera OpenAI à rendre son produit moins bien et plus cher sitôt la concurrence écrasée ou le status quo établi
C'est le modèle startup classique.
Ils vendent à perte, ce sont les investisseurs qui paient, le but étant de saisir le maximum de part de marché en un minimum de temps.
Une fois le marché stabilisé et en position dominante ils vont en effet se shitifier et faire payer les utilisateurs, passant de gouffre financier à machine à cash.
Ils vendent à perte, ce sont les investisseurs qui paient, le but étant de saisir le maximum de part de marché en un minimum de temps.
Une fois le marché stabilisé et en position dominante ils vont en effet se shitifier et faire payer les utilisateurs, passant de gouffre financier à machine à cash.
il y a un an
Pour te donner une idée, Stable Diffusion en local ça ressemble à ça :
Comme c'est infâme et inutilisable en lignes de commandes, j'utilise une librairie graphique qui s'appelle Gradio,
Comme c'est un modèle plus graphique et moins LLM qu'un ChatGPT, faut aussi adapter le prompt spécifiquement, j'ai tenté celui-ci :
Pour te donner une idée de la granularité du truc, ici sur une seed au hasard, j'ai lancé avec 2 paramètres variables : le nombre d'itérations croissant, et la variance par rapport au prompt décroissante. C'est à dire que plus on est à gauche, plus l'image est rapide à générer (la vitesse se paie en manque de qualité), plus on est en haut, plus elle est fidèle au prompt (la fidélité peut se payer en cohérence ou en harmonie). et j'obtiens les résultats suivants :
Alors certes, les résultats sont loin d'être ceux que tu attends, mais ça vient plus de mon propre manque de motivation : pour avoir un résultat parfait, il faut installer les bons LoRa naruto et/ou trading cards, itérer sur un grand nombre de seeds avec une grande rapidité, quand tu obtiens une seed qui te convient tu fais une matrix avec plusieurs paramètres comme je t'ai montré, puis quand tu as une image qui te convient tu fais de l'inpainting pour gommer les dernières imperfections.
Le process de recherche de Seed tu le fais aussi sur ChatGPT, il te file souvent plusieurs images et tu choisis celle que tu veux, par exemple ici j'en génère 5 sur des seeds aléatoires :
Beaucoup de résultats peu fidèles, et je trouve les résultats trop glossy, je les veux plus animés, alors... bah merde je dois chercher un Lora, genre celui là, que je télécharge :
https://civitai.com/model[...]5476/naruto-or-style-lora, et que je colle dans mon dossier stable-diffusion-webui\models\Lora, et puis je relance une recherche de seed aléatoires :
Je trouve les résultats mieux en terme de Naruto, qui que c'est toujours que Naruto et Sasuke, donc belotte :
https://civitai.com/model[...]namikaze-naruto-shippuden. Aussi, c'est pas très "trading card", donc rebelotte :
https://civitai.com/models/741650/trading-card (et en fait non ça marche pas ce Lora et je sais pas pourquoi mais flemme de chercher en détail ):
Je trouve que cette horreur pourrait à peu près faire l'affaire, en dépit du REFUS de faire minato putain :
Donc je l'envoie en img-2-img, c'est à dire qu'à partir de maintenant je n'itère plus à partir de rien, mais à partir de cette image. Le process change assez peu : on recherche une seed où ça un peu de gueule, et aussi on itère par rapport à la photo, c'est à dire qu'on conserve cette image dans la bruit. Ici, j'ai fait une recherche où plus on est à gauche, moins l'image est conservée (ici de 33% à 88%) et donc plus elle sera fidèle à l'originale :
A force d'itérations, je devrais arriver à un résultat un poil plus convenable. Là, mon résultat est à comparer avec ce qu'on pouvait faire sur ChatGPT il y a environ 8 mois, quand j'ai installé mon modèle, parce que j'avoue ne plus du tout utiliser Stable Diffusion vu la TANNE que c'est pour un résultat plutôt médiocre si je n'y mets pas le temps.
Bref, je n'arrive pas au résultat que tu as avec ChatGPT, même en y mettant du temps et des efforts, mais je pense que pour un truc qui tourne en local sur mon PC plutôt que sur des serveurs qui coûtent des millions par jour à des investisseurs américains et qu'il faudra un jour rentabilisé, je m'en sors pas si mal
D'autant que ce que je perds en commodité, il faut tout de même souligner que je le gagne en liberté : là où ChatGPT est un assistant, Stable Diffusion est un outil complet qui te donne beaucoup, beaucoup plus de liberté.
Ah oui, aussi, vu que c'est pas détenu par des puritains américains mais que ça tourne localement sur mon PC, je peux faire du NSFW ou des images politiques.
Comme c'est infâme et inutilisable en lignes de commandes, j'utilise une librairie graphique qui s'appelle Gradio,
Comme c'est un modèle plus graphique et moins LLM qu'un ChatGPT, faut aussi adapter le prompt spécifiquement, j'ai tenté celui-ci :
SD prompt
Minato Namikaze, Naruto Kayou trading card style, vibrant holographic effects, dynamic pose, Rasengan in hand, teleportation kunai in other hand, sleek design, visually impressive, detailed background, high contrast, cinematic lighting, intricate details, anime aesthetic, bold colors, sharp focus, dramatic shadows, futuristic elements, glowing aura, action-packed, iconic Naruto character, epic scene, professional illustration.
Pour te donner une idée de la granularité du truc, ici sur une seed au hasard, j'ai lancé avec 2 paramètres variables : le nombre d'itérations croissant, et la variance par rapport au prompt décroissante. C'est à dire que plus on est à gauche, plus l'image est rapide à générer (la vitesse se paie en manque de qualité), plus on est en haut, plus elle est fidèle au prompt (la fidélité peut se payer en cohérence ou en harmonie). et j'obtiens les résultats suivants :
Alors certes, les résultats sont loin d'être ceux que tu attends, mais ça vient plus de mon propre manque de motivation : pour avoir un résultat parfait, il faut installer les bons LoRa naruto et/ou trading cards, itérer sur un grand nombre de seeds avec une grande rapidité, quand tu obtiens une seed qui te convient tu fais une matrix avec plusieurs paramètres comme je t'ai montré, puis quand tu as une image qui te convient tu fais de l'inpainting pour gommer les dernières imperfections.
Le process de recherche de Seed tu le fais aussi sur ChatGPT, il te file souvent plusieurs images et tu choisis celle que tu veux, par exemple ici j'en génère 5 sur des seeds aléatoires :
Beaucoup de résultats peu fidèles, et je trouve les résultats trop glossy, je les veux plus animés, alors... bah merde je dois chercher un Lora, genre celui là, que je télécharge :
Je trouve les résultats mieux en terme de Naruto, qui que c'est toujours que Naruto et Sasuke, donc belotte :
Je trouve que cette horreur pourrait à peu près faire l'affaire, en dépit du REFUS de faire minato putain :
Donc je l'envoie en img-2-img, c'est à dire qu'à partir de maintenant je n'itère plus à partir de rien, mais à partir de cette image. Le process change assez peu : on recherche une seed où ça un peu de gueule, et aussi on itère par rapport à la photo, c'est à dire qu'on conserve cette image dans la bruit. Ici, j'ai fait une recherche où plus on est à gauche, moins l'image est conservée (ici de 33% à 88%) et donc plus elle sera fidèle à l'originale :
A force d'itérations, je devrais arriver à un résultat un poil plus convenable. Là, mon résultat est à comparer avec ce qu'on pouvait faire sur ChatGPT il y a environ 8 mois, quand j'ai installé mon modèle, parce que j'avoue ne plus du tout utiliser Stable Diffusion vu la TANNE que c'est pour un résultat plutôt médiocre si je n'y mets pas le temps.
Bref, je n'arrive pas au résultat que tu as avec ChatGPT, même en y mettant du temps et des efforts, mais je pense que pour un truc qui tourne en local sur mon PC plutôt que sur des serveurs qui coûtent des millions par jour à des investisseurs américains et qu'il faudra un jour rentabilisé, je m'en sors pas si mal
D'autant que ce que je perds en commodité, il faut tout de même souligner que je le gagne en liberté : là où ChatGPT est un assistant, Stable Diffusion est un outil complet qui te donne beaucoup, beaucoup plus de liberté.
Ah oui, aussi, vu que c'est pas détenu par des puritains américains mais que ça tourne localement sur mon PC, je peux faire du NSFW ou des images politiques.
Écoutes, je t'avoues que tu me parles chinois là, mais de ce que je vois, ça n'arrive quand même pas à la cheville de ChatGPT qui met quand même une sacrée longueur d'avance à SD.
il y a un an
Écoutes, je t'avoues que tu me parles chinois là, mais de ce que je vois, ça n'arrive quand même pas à la cheville de ChatGPT qui met quand même une sacrée longueur d'avance à SD.
Je pense qu'un mec qui manie bien l'outils arrivera à un bon resultat oui, j'ai aucune formation dessus et mon modèle est plutôt vieillissant. Je voulais juste te montrer l'incroyable assistance qu'est chatgpt. Même avec de l'IA generative, c'est vraiment pas évident de faire ce que tu veux et ça demande beaucoup de tâtonnement.
il y a un an
Je pense qu'un mec qui manie bien l'outils arrivera à un bon resultat oui, j'ai aucune formation dessus et mon modèle est plutôt vieillissant. Je voulais juste te montrer l'incroyable assistance qu'est chatgpt. Même avec de l'IA generative, c'est vraiment pas évident de faire ce que tu veux et ça demande beaucoup de tâtonnement.
Ok.
Merci pour ton retour enrichissant en tous cas. 👍
Merci pour ton retour enrichissant en tous cas. 👍
il y a un an
Oui ChatGPT c'est incroyable perso j'ai l'abo et je l'utilise tous les jours
il y a un an
il y a un an
En ligne
101
Sur ce sujet0





















