Hugging Face : comment partir de zéro ?

a marqué ce sujet comme résolu.

Bonjour à tous,

Me sachant désireux d’installer une IA pour l’utiliser hors connexion sur Windows 11, @Romantik me recommande amicalement de visiter cette page : https://huggingface.co/

Je n’en comprends pas un traitre mot, un seul code ou concept.

Comment faut-il s’y prendre pour trouver :

  • un premier repère ?
  • où poser une question dans ce forum quand, totalement perdu, on ne peut nommer ce qu’on ne comprend pas ?

Si, pour les concepteurs d’une telle page, la nouvelle façon de faire société est d’envoyer les débutants promener ─ pas un mot d’aide ! ─, je n’ose imaginer la nouvelle définition de la muflerie.

Merci de m’avoir lu et bon plaisir avec l’informatique à vos niveaux plus avancés :-)

Marc

+0 -0

De toute évidence, ce site n’est pas à destination des grands débutants qui n’ont aucune notion de développement ou d’IA. Même leurs « beginner-friendly tutorials » semblent à destination des personnes débutantes dans l’installation de modèles hors ligne, mais qui ont déjà des notions de programmation et d’IA.

D’autre part, @Marccum : attention à ta communication. Je comprends ta frustration et que tu aies besoin de l’exprimer ; mais tes invectives contre les concepteurs des pages brouillent ton besoin et ne donnent pas une bonne image de toi.

Alors, j’ai compris un peu après que tu cherchais certainement une alternative locale à chatGPT, c’est pourquoi j’ai édité mon message pour proposer GPT4All dans lequel tu pourras utiliser un petit model local comme mistral-7b-Instruct.
Mais il faut comprendre que le domaine de l’IA connait un nouvel essor récemment avec la venue des Large Language Model (LLM), et c’est encore très actif, il y a des innovations tout les jours.
Par conséquent, les IA génératives sont encore très expérimental, il faut comprendre et connaitre le système pour pouvoir l’utiliser correctement (pourquoi il y a tant de choix, c’est quoi la différence, quelle machine il me faut, que valent les réponses fournies …), ce n’est pas prêt pour le grand public, il faut être un utilisateur averti.
Aussi les LLMs requièrent beaucoup de ressources (surtout à l’entrainement, c-à-d la fabrication), des travaux pour les réduire sont en cours mais c’est pour ça que les acteurs majeurs des LLM sont ceux qui ont beaucoup de moyen, les GAFAM sont très avantagés.

+2 -0

D’après le second paragraphe du lien que j’ai donné dans mon message précédent :

The tutorials assume some basic knowledge of Python and a machine learning framework like PyTorch or TensorFlow.

Donc il faut que tu apprennes Python, par exemple via ce tutoriel sur Zeste de Savoir ou celui du site officiel ; puis que tu t’intéresses à PyTorch ou Tensorflow.

Note que sur Zeste de Savoir, la communauté (et je m’inclus dedans) n’a rien contre aider des débutants, même de grands débutants (on est tous passés par là). Par contre, on suppose que nos interlocuteurs vont utiliser leurs petites cellules grises, réfléchir et chercher par eux-mêmes. Donc, si tu cherches du travail pré-mâché, tu n’es sans doute pas au bon endroit.

Cherche des articles ou vidéo de vulgarisation, comme par exemple science étonnante (elle commence à daté un peu pour un sujet qui évolue si vite mais ça donne déjà de bonnes bases et j’en ai pas d’autres sous le coude)

S’il te manque du vocabulaire, cherches dans des dictionnaires ou des encyclopédies. Wikipedia est une mine d’information impressionnante.

+2 -0

@romantik, @SpaceFox, Si vous ne souhaitez ou ne pouvez pas répondre à ma question de base, il n’y a pas de problème :-)

Marccum

Bonjour,

Avertissement officiel de la modération

Cette réponse à la remarque — parfaitement fondée — de @SpaceFox et le vocabulaire de certains de tes messages (y compris sur le sujet précédent) généralisant quelque peu l’attitude de certains sur l’ensemble des "personnes douées en informatique" (muflerie, moquerie, "planqué"…) sont particulièrement déplacés.

C’est une chose d’émettre une critique sur l’accessibilité d’un domaine aux débutants ou sur le comportement de certaines personnes, c’en est une autre d’user sciemment de provocations envers des tiers (la communauté de ZdS), surtout quand ceux-ci ont passé des années à aider les curieux.

Alors je réitère le message de @SpaceFox et ce, en tant que modérateur :

D’autre part, @Marccum : attention à ta communication. Je comprends ta frustration et que tu aies besoin de l’exprimer ; mais tes invectives contre les concepteurs des pages brouillent ton besoin et ne donnent pas une bonne image de toi.

Les règles de courtoisie et d’ouverture d’esprit (en l’espèce, la compréhension du fait que tous les outils ne sont pas forcément accessibles aux grands débutants (ce qui est foncièrement inéluctable, il faut apprendre à marcher avant de pouvoir courir)) doivent être respectées.

Merci d’avance.

+4 -0

Cherche des articles ou vidéo de vulgarisation, comme par exemple science étonnante (elle commence à daté un peu pour un sujet qui évolue si vite mais ça donne déjà de bonnes bases et j’en ai pas d’autres sous le coude)

En quoi c’est daté et de fait non pertinent ?

Je n’ai pas l’impression que les bases aient changé concernant ces LLM depuis cette vidéo.

+0 -0

J’ai pas dit que c’était pas pertinent, c’est juste que c’est pas à jour et ça se voit car il l’illustre par GPT 3.5, et je crois que les solutions à la problématique qu’il expose à la fin (rechercher les sources) ont un peu progressé. Mais les bases sont tout à fait valides oui !

Après je suis pas le secteur de très près, je sais pas s’il y a de nouvelles astuces d’apprentissage dont il aurait pu parler dans une vidéo plus récente, genre pour réaliser le tour de force de mistral pour avoir quelque chose d’aussi performant en 7b. Ou encore pour rester sur mistral ai, comment faire l’inférence sur une combinaison de model spécialisé avec mixtral 8x7b.

+0 -0

J’ai pas dit que c’était pas pertinent, c’est juste que c’est pas à jour et ça se voit car il l’illustre par GPT 3.5, et je crois que les solutions à la problématique qu’il expose à la fin (rechercher les sources) ont un peu progressé. Mais les bases sont tout à fait valides oui !

Mouais s’ils ont ajouté des fonctionnalités, cela ne change pas fondamentalement leurs limites et domaines d’applications.

Pour la question des sources je n’ai entendu aucune information allant en ce sens, il faut dire que par la conception même de ces outils ce n’est pas trivial sans faire grossir de manière exagérée le modèle. En tout cas pour des systèmes non spécialisés comme ChatGPT.

+0 -0

Je pense surtout à Copilot/BingAI (intégré dans edge) qui annote ses phrases pour donner des liens. Mais la solution n’est pas dans le model non, l’idée c’est de coupler la génération à un moteur de recherche pour retrouver quelque part ce qu’on a généré et le donner en tant que source.

+0 -0

Ah ! Merci, @romantik, @SpaceFox, @Arius, maintenant, j’ai une base de travail :-)

Une petite chose encore. Si des paresseux ont déjà profité de vous, je le regrette et comprends votre réaction. Toutefois, j’enseigne une langue difficile à de grands débutants perdus. Les larguer parce qu’ils ne trouveraient pas les bases ne me viendrait jamais à l’idée. Alors faisons la paix et faisons société, merci :-)

+0 -0

Salut !

@Marccum personnellement je comprends ta frustration, et je déplore le recadrage public orchestré par @Spacefox ou @Arius (une mise au clair en privé aurait été beaucoup plus à propos).

Je me répère quand je dis que je comprends totalement ta frustration car on est dans une situation où l’IA semble à la fois avancée et inaccessible.

Si tu te considères comme débutant, à titre personnel, je te recommenderais ces ressources pour te mettre dans le bain :

  • https://zestedesavoir.com/tutoriels/2514/un-zeste-de-python/ — je n’ai personnellement pas suivi ce tutoriel mais son auteur fait partie de mon référentiel de meilleurs connaisseurs que je connaisse (et ça me coûte de dire ça). Avec entwanne tu peux avoir l’assurance d’avoir zéro bullshit sur ce que tu vas apprendre, et il saura répondre à tes interrogations si tu en as (je pense qu’il est suffisamment pédagogue pour que tu aies peu de questions à poser). Ici, il serait intéressant que tu oublies l’IA. Concentre-toi sur comment programmer en python et trouver des projets un peu plus à ta portée de débutant (le jeu du plus ou moins, pour ne citer que lui).
  • https://openclassrooms.com/fr/courses/8063076-initiez-vous-au-machine-learning — ce cours d’OC n’est pas parfait, il y a sûrement des erreurs aussi, mais son auteur est accessible sur LinkedIn si tu as des questions. Ici tu feras tes premiers pas en IA et tu apprendras à utiliser tes premiers modèles de prédiction.
  • https://zestedesavoir.com/articles/1654/deep-learning-cest-quoi/ — On revient sur ZdS avec un article qui a attiré mon attention, mais je n’ai pas creusé suffisamment pour te faire un retour dessus. En tout cas, il m’a l’air excellent. Ici tu vas utiliser des réseaux de neurones pour faire de la reconnaissance de caractères. Il me semble que ça s’apparente à de l’IA, si je ne dis pas de bêtises.

Pour le reste, il faut que tu gardes à l’esprit que tu es sur un site de faux débutant. Tu croiseras souvent les mêmes personnes expertes dans leur domaine, assez « roots » pour la plupart, qui rejettent un peu les technologies au goût du jour (blockchain, cryptomonnaies, certains domaines de l’IA) donc je te conseille de prendre du recul sur les réponses que tu as pu recevoir… Et te mettre à l’anglais pour aller chercher du contenu ailleurs.

Si des paresseux ont déjà profité de vous, je le regrette et comprends votre réaction.

Disons qu’on le cherche un peu quand on voit la promesse faite par un site associatif, sans moyen de monétisation autre que les dons (alors qu’ils passent par la plateforme d’une entreprise, qui capitalise sur ces dons à sa manière !).

Personne ne profite de personne ici. Si quelqu’un a le sentiment de perdre du temps en t’aidant, qu’il ne t’aide pas. J’ai personnellement du mal à voir en quoi le temps est perdu quand tu aides ton prochain (a minima ça t’apprend la patience, à communiquer efficacement et ça élargit tes connaissances éventuellement).

À bientôt !

@Marccum personnellement je comprends ta frustration, et je déplore le recadrage public orchestré par @Spacefox ou @Arius (une mise au clair en privé aurait été beaucoup plus à propos).

Il n’est pas nécessaire de faire un "recadrage" privé en l’espèce. C’est un acte de modération tout à fait normal.

Et encore une fois, cela n’enlève rien au fait que le fond (la frustration) est parfaitement légitime. C’est la forme qui pêche et il est normal qu’en conséquence de la publicité des propos, le "recadrage" le soit aussi. Ceci afin que tout le monde soit sur la même longueur d’onde.

Par ailleurs, le fait de suggérer que le recadrage a été "orchestré" est tout aussi déplacé. Ce "recadrage" ne te plaît peut-être pas, soit. Mais ce n’est pas mon problème.

Maintenant, le débat est clos et on reprend le sujet.

Merci. :)


@Marccum

Une petite chose encore. Si des paresseux ont déjà profité de vous, je le regrette et comprends votre réaction. Toutefois, j’enseigne une langue difficile à de grands débutants perdus. Les larguer parce qu’ils ne trouveraient pas les bases ne me viendrait jamais à l’idée. Alors faisons la paix et faisons société, merci :-)

L’idée de ZdS n’est absolument pas de larguer les grands débutants. Bien au contraire. On s’efforce justement à ce que le site soit le plus accessible possible, peu importe la matière. ;)

+5 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte