Mots clés |
Capital-risque, Clustering, Écosystèmes entrepreneuriaux, Entrepreneuriat, Innovation, Réseaux complexes, Scientométrie, Startups, Systèmes complexes |
Resumé |
Le capital-risque, par ses choix d'allocation de capital financier, est devenu un moteur important des technologies émergentes. L'impact du financement par le capital-risque sur l'innovation et la résilience de l'innovation soutenue par le capital-risque ont été récemment étudiés, une question particulièrement pertinente dans un monde où les crises sont de plus en plus fréquentes. De plus, les réseaux d'innovation d'une part et les réseaux de capital-risque d'autre part ont fait l'objet d'études quantitatives, mais la structure du réseau reliant le capital-risque aux technologies qu'il finance n'a jamais été étudiée. Afin d'étudier sa structure topologique, nous effectuons une analyse à grande échelle de données financières, de startups et de brevets obtenues à partir de bases de données commerciales. Le réseau reliant les investisseurs et les brevets est bipartite, les deux classes de noeuds étant les investisseurs et les brevets. Ce réseau est grand et éparse, rendant son analyse computationellement difficile, et ne tient pas compte du fait que les investisseurs appartiennent à des types distincts et les brevets à des catégories technologiques. Nous y remédions en créant des groupes de noeuds homogènes dans chaque classe (clusters) afin de créer un réseau à plus gros grains, permettant de réduire la taille et de densifier le réseau. Dans la première partie, nous présentons une nouvelle méthode de clustering pour les investisseurs en capital-risque dans les écosystèmes entrepreneuriaux. Nous calculons 5 distributions caractéristiques pour chaque investisseur individuel basées sur leurs investissements. En utilisant le graphe de similarité reliant tous les investisseurs, nous détectons des communautés d'investisseurs homogènes hautement interprétables. Nous montrons la robustesse de cette approche à la décimation des caractéristiques, suggérant des schémas d'investissement complexes sous-jacents. Ces résultats permettent également l'observation de l'émergence de nouveaux acteurs du capital-risque à la suite d'événements spécifiques et identifiables. Dans la deuxième partie, du fait de la nature textuelle des données de brevets que nous souhaitons regrouper, nous présentons une méthode de topic modeling permettant l'extraction automatique de groupes de documents thématiquement similaires à partir d'un corpus de documents textuels. Pour la valider, nous l'appliquons à un corpus de plus petite taille composé de documents présentant une structure similaire à celle des brevets : des articles scientifiques. Nous utilisons des modèles de traitement du langage naturel pour extraire automatiquement les thèmes de recherche à partir des titres et résumés des articles, et analysons les résultats. Dans la troisième partie, nous présentons une étude de l'écosystème de financement de l'innovation menée par les startups. Nous construisons un réseau bipartite reliant directement les investisseurs aux brevets détenus par les startups qu'ils financent. Nous nous sommes appuyés sur les approches décrites précédemment pour regrouper les noeuds des investisseurs et les noeuds des brevets, créant ainsi un réseau à plus gros grain. En utilisant des métriques structurelles développées à l'origine pour étudier les réseaux bipartites en écologie, nous avons constaté que ce réseau est topologiquement mutualiste, avec une distribution des degrés hétérogène, une forte imbrication et une faible modularité. Cette structure spécifique est due à la prévalence des liens entre investisseurs généralistes et technologies génériques, c'est-à-dire des technologies ayant un large spectre d'applications. Cette structure de réseau implique une réponse non linéaire aux crises, avec un système faiblement affecté par les événements délétères touchant les noeuds spécialistes et fortement affecté par les événements négatifs ciblant les noeuds généralistes. |