Bonsoir et merci pour l'invitation. Moi je vais vous parler d'un cas concret d'utilisation
de Big Data et ce cas-là n'a pas déçu. Et je vais commencer par là pour dire pourquoi
ce cas n'a pas déçu et parler de ma définition du Big Data et la première fois que j'ai
entendu parler de ce mot-là. C'était il y a un peu plus de dix ans et c'était pas
la technologie qu'on connaît aujourd'hui. C'est une superbe opportunité. Mais on
disait Big Data quand on avait un gros problème pour traiter une grosse masse de données et
qu'on n'avait pas la technologie pour le faire ou alors qu'on avait beaucoup de données
mais qui étaient tellement déstructurées qu'on ne savait pas le faire ou alors qu'on
avait beaucoup de données mais qui arrivaient en flux réel et qu'on ne savait pas le traiter.
Et plus tard, sont arrivés ces techniques de Big Data qui permettent de faire ça et
ça ouvert beaucoup beaucoup d'opportunités. Et je pense personnellement que quand la Big
Data est utilisée comme ça, on ne cherche pas la Big Data mais quand ces technologies
de Big Data viennent résoudre un problème qui existe depuis très longtemps mais aujourd'hui
les technos permettent de le gérer, on peut créer de la valeur. Et l'exemple qui est
là, Data & Data, une société qu'on a créée il y a quatre ans pour résoudre un problème
qui est le problème de la contrefaçon sur Internet. Donc je ne vais pas vous poser la
question à ce que vous avez déjà vu de la contrefaçon. Tout le monde en a vu sur
les marchés et je pense une grande proportion des personnes ici. On en a peut-être vu
aussi sur Internet. C'est un fléau. Le marché de la contrefaçon, c'est à peu près 400,
un peu plus de 400 milliards de dollars par an. Et pour vous donner une idée, c'est
à peu près trois fois le marché de la drogue. Je ne suis pas un spécialiste de la drogue
mais j'imagine que c'est un gros marché. Et donc c'est trois fois plus gros que la
drogue et c'est dix fois plus rentable que la drogue. Et donc ce que j'affiche ici
sur l'écran, c'est la vitesse à laquelle on détecte la contrefaçon sur Internet.
Vous voyez une carte du monde. On ne fait pas la démonstration en temps réel mais croyez-moi
on l'a filmé hier, à peu près dans l'après-midi. Donc vous avez une carte du monde avec
des points qui s'intigrent. Et chaque point qui s'intigre sur l'écran est un vendeur
qu'on vient de détecter. Un vendeur, pas une vente. Ça ne s'arrête pas. Ça ne s'arrête
pas. Vous voyez, il y a pas mal de choses au Mexique, il y a pas mal de choses aussi
en Australie. Il y a pas mal de bleu et de blanc. C'est ça la vraie vitesse de la contrefaçon.
Sur une dizaine de marques pour lesquelles nous faisons cette surveillance. Il y a pas
pas mal de bleu aussi sur cet écran. Les bleus, ce sont des vendeurs sur Facebook. Blanc,
je vois du blanc au Mexique, ce sont des vendeurs sur Twitter. Et peut-être qu'on
va voir apparaître d'autres couleurs qui nous montrent des sites web ou des places
de marché. Donc c'est ça. Donc maintenant, essayons de résoudre ce problème-là autrement
que par la Big Data, c'est-à-dire en cherchant avec des moteurs de recherche. On va sur
Google ou sur d'autres moteurs de recherche et en cherchent votre marque préféré, pas
cher. Et vous allez trouver un listing de gens qui vendent ça. On ne peut pas atteindre
cette vitesse-là. Ou alors il faudrait aligner 300 personnes par marque, par maison de luxe,
par maison de mode pour faire ce travail-là. Et donc c'est ça le problème. On a beaucoup
de données. On ne sait pas les traités avec les moyens qui existent. On ne savait pas
les traités avec les moyens qui existaient. On sait maintenant les traités avec le Big
Data. Donc que fait ça? Que fait ce produit de data-in-data? Fait deux choses. C'est
un moteur de recherche qui va partout. Partout, c'est-à-dire sur des sites web, sur des places
de marché et sur les réseaux sociaux. Beaucoup de réseaux sociaux. Et qui va chercher,
identifier une marque de données ou un produit de données qu'on cherche à suivre. Il va
trouver ce produit-là, quelqu'un qui mentionne ce produit-là. Ce moteur va essayer de comprendre
si cette personne est simplement en train de mentionner le produit ou s'il est en train
de le vendre. Et ensuite s'il est en train de le vendre, il va essayer de savoir s'il
est en train de vendre un produit original ou un produit contre fait. Et ça, il faut
que ça se fasse très, très vite. Parce que Twitter, c'est des centaines de millions
de tweets. Parce que Facebook, c'est 1,5 milliard de personnes dans le monde qui postent
tous les jours. Parce que WeChat, c'est 900 millions dans le monde qui postent aussi sur
WeChat tout le temps. Voilà, c'est ça le volume qu'on doit traiter. Et donc essayer
de traiter ça avec des techno d'il y a 5 ans, 6 ans, ça ne peut pas fonctionner.
Ça, c'est le premier point et c'est pour ça que l'AbigData apporte une solution.
La deuxième chose, c'est que les gens qui vendent des produits contre fait sur des
plateformes de e-commerce ou sur des réseaux sociaux, il va vendre son sac ou ses lunettes
ou les pièces détachées ou les médicaments. Voilà, il va poster son produit, peut-être
mettre une photo et mettre un prix. C'est de l'information qui est totalement déstructurée,
non structurée plutôt, non structurée. Et donc, il faut la comprendre. Et cette technologie
là qui permet de comprendre une information non structurée n'était pas assez mature
il y a quelques années et ne s'en arrivait qu'avec le Big Data. Donc c'est la deuxième
chose pour laquelle l'AbigData apporte quelque chose. Et troisièmement, c'est que comme
je l'ai dit, c'est un moteur de recherche, mais il y a pas mal de moteurs de recherche
qui fonctionnent assez bien dans le monde. C'est un moteur de recherche qui va pas
simplement vous donner un résultat qui mentionne le produit ou la marque que vous
cherchez, mais qui va vous dire que cette personne est en train de la vendre et qu'il
est en train de vendre un produit contre fait. Donc il y a une sorte d'intelligence.
Et cette intelligence là, si on ne peut pas mettre 500 personnes pour chaque marque pour
la traiter, il faut qu'on arrive à les modéliser et créer de l'intelligence artificielle qui
fait ça. Et l'intelligence artificielle, ces dernières années, a connu une accélération
extrêmement rapide. Non pas que la théorie elle-même a connu une accélération rapide,
mais c'est le support technologique qui a évolué. Support c'est quoi? C'est le
cloud. Si il n'y avait pas le cloud, on n'y pourrait pas faire ça. On ne parlerait pas
de Big Data aujourd'hui. Ça c'est la première chose. C'est le hardware, c'est-à-dire ce
sont les machines sur lesquelles on fait ces algorithmes-là qui ont évolué. Et troisièmement,
et c'est l'essentiel, vraiment le point essentiel, c'est qu'on a beaucoup plus de
données. Donc ces algorithmes d'intelligence artificielle deviennent intelligents plus
rapidement. Ce qu'on fait nous, ce qu'on a fait, est qu'on a fait pendant des semaines
ce travail-là manuellement. Donc on a cherché des sites de gondroissance, on a cherché
des gens qui vendent sur les plateformes et qui vendent sur les réseaux sociaux. On les
recherchait manuellement et c'est un humain qu'il les a trouvé. Ensuite on a injecté
ça dans des algorithmes d'intelligence artificielle. Il y a en effet un apprentissage supervisé
au départ. Pour modéliser ce jugement humain, lorsqu'il tombe sur le texte d'une photo,
va comprendre que c'est une personne qui est en train de vendre et qu'en plus ce produit-là
est contre fait. C'est ça l'exemple pratique de l'application du Big Data, mais pas que
le Big Data. Le Big Data n'est pas suffisant. Big Data a plus d'intelligence artificielle
pour résoudre d'un problème. Donc voilà, on voit là un peu sur l'écran des points
orange qui sentient énormément en Chine. Ce sont des sites web. À quoi ressemble le
produit? Il ressemble à ça. Le moteur de recherche est en train de chercher et dès
qu'il trouve un vendeur, quelqu'un qui vend, qui s'assure vraiment que c'est un vendeur
de contemplation, il va le mettre à disposition sur une plateforme qui est comme celle-ci,
qui est pratiquement une boîte mail où on a un petit aperçu du poste. Je pense que
c'est quelqu'un sur Instagram. Et le propriétaire de cette marque-là, c'est un
vice juridique, peut réagir automatiquement en signalant ce poste-là ou ce site-là ou
cette vente-là à la plateforme. Donc imaginez tous les points que vous avez vus scintiller.
Je pense qu'on a vu plusieurs centaines, peut-être 1 000 ou 2 000 là en quelques minutes. Imaginez-vous
faire ça ou payer des gens pour faire ça manuellement. C'est impossible. Donc on passe
dans une autre génération de lutte contre la contemplation sur Internet. Et d'ailleurs,
les résultats sont extrêmement parlants. Cette techno-là, quand elle est arrivée, a multiplié
les résultats obtenus par les marques de l'ordre de 30, 50, 80%, ça dépend du niveau dans
lequel se trouver les marques, qui ressemble à ça. Et ce qui est extrêmement important,
parce qu'on l'a vu sur la première intervention, ce qui est important, c'est aussi de visualiser
cette grosse masse de données. Au final, ce qu'on veut, c'est de la valeur, ce n'est
pas de la donnée. Et donc ce qui est important, c'est 1, de réagir, ce que je vous ai montré
et 2, de pouvoir comprendre cette menace-là. Donc c'est de cartographier son risque de
contrefaçon dans le monde. Et donc de comprendre sur quel canal ça se passe, dans quel pays
du monde, quelles sont les produits les plus contrefaits, quelles sont les concurrents
qui se trouvent sur les mêmes sites ou les confrères ou les maisons similaires à la
mienne qui se trouvent sur les mêmes sites, sur lesquelles sont vendues les contrefaçons
pour peut-être envisager des actions communes. Et quelle est l'évolution de la contrefaçon
plateforme par plateforme pour suivre l'efficacité de mon action. Je ne terminerai pas par un
autre point qui est sous-jacent à ce sujet de Big Data. Mais Big Data, c'est vraiment
des données, beaucoup de données qui sont structurées ou non structurées qui arrivent
rapidement ou pas. Dans notre cas, elles sont non structurées, elles sont en temps réel.
Et quand on trouve beaucoup de vendeurs de contrefaçon, on s'aperçoit que ce ne sont
pas des vendeurs isolés. Ce n'est pas quelqu'un qui a acheté quelques produits parce qu'il
est parti en vacances en Turquie ou en Thaïlande et qu'il est de retour en France pour vendre
ça à ses amis. Ce sont des réseaux criminels. Et ces réseaux-là, je vous ai dit que c'est
un marché de 400 milliards de dollars par an, sont très structurés, sont extrêmement
intelligents, c'est des génie de l'informatique. Donc les techniques pour référencez leurs
ventes, leurs sites, leurs comptes sur Facebook ou Instagram ou n'importe quelle plateforme,
ont sortes qu'elles soient visibles, sont dignes des meilleures techniques de marketing
des plus belles marques. Et donc, ils n'ont pas un seul site. Un vendeur peut avoir 500
mille sites parce qu'il sait très bien qu'un jour ou l'autre, la marque va le trouver,
il va fermer son site. Donc il en ouvre plein. Il n'a pas un seul compte sur Facebook, mais
il en a 200 ou 300. Et donc, quand on cherche bien tous ces vendeurs-là, on arrive à les
connecter grâce à des caractéristiques communes. Donc on arrive dans une sorte de
graph. Et là, arrive la problématique des très gros graph. Donc là, c'est un petit
graph. Donc chaque neuf est un vendeur. Et le lien, c'est le lien de paranter entre ces
vendeurs-là, donc des vendeurs qui sont reliés entre eux, soit les mêmes, soit apparentés.
Ça veut dire quoi? Ça veut dire des deux sites web qui utilisent exactement les mêmes
images qui sont peut-être hébergés sur le même serveur. On trouve les mêmes numéros
de téléphone, les mêmes images. Donc vous voyez que c'est le même, finalement. C'est
la même organisation qui est derrière tout ça. Et ce qui est important pour une marque,
c'est de ne pas agir un par un, mais c'est de repérer ce réseau-là et d'agir sur l'ensemble
du réseau. Et donc quand on arrive sur un très gros réseau qui est comme ça, il y a
de techniques qui rentrent en jeu pour trouver le maillon faible de ce réseau-là. Quel
est le point d'entrée pour que je puisse avoir une action juridique intéressante parce
qu'il n'est pas aussi simple d'agir en France, en Europe, aux États-Unis, en Russie,
et ces sites et ces vendeurs sont dispatchés un peu partout, même si l'organisation qui
est derrière tout ça est la même. Donc je vais m'arrêter là pour la présentation.
Ça, c'est un exemple d'application, non pas que du Big Data, mais le Big Data est tout
ce qui vient autour du Big Data. Le Big Data permet de gérer une grosse volumétrique
donnée non structurée en temps réel. Mais le cœur de notre activité, c'est l'intelligence
artificielle, mais on sait que s'il n'y avait pas assez de technologies de Big Data,
on n'aurait pas passé cette nouvelle ère pour créer cette nouvelle génération de
solutions anti-controversants sur Internet.
