La science des données comme point de départ
La data science est un fabuleux mélange de statistiques et d'informatique pour transformer des données brutes en information. Avant de concevoir des procédures d'IA, les données sont collectées, préparées et analysées. L'objectif étant de les valoriser et d'en extraire des informations. Plusieurs types d'analyses viennent en soutien à cette discipline, notamment :
- L'analyse descriptive (analyse et compréhension d'un événement)
- L'analyse prédictive (mise en place de mécanismes pour prédire des événements)
- L'analyse prescriptive (automatisation de certaines actions selon l'analyse de ces résultats)
Dans un second temps, le machine learning, champ d'étude de l'intelligence artificielle, est alimenté par les données analysées. Il fonctionne à travers des modèles qui apprennent automatiquement et en continu grâce aux retours de nos utilisateur·trice·s.
Ces méthodes sont particulièrement précieuses dans la construction de prédictions pour aider les dirigeant·e·s à prendre des décisions éclairées.
Les premiers pas du machine learning à l'Etat
A l'OCSIN par exemple, nous sommes capables de prédire les dysfonctionnements des serveurs et bases de données. Pour réaliser ce type d'analyse, les logs serveurs et applicatifs sont capturés et centralisés. Cet historique, qui contient les éléments composant ces événements, permet l'entraînement et la validation des modèles qui seront par la suite déployés en production.
L'intelligence artificielle a aussi fait ses preuves au sein des offices de notre administration cantonale. Au service des prestations complémentaires, elle permet d'identifier les informations potentiellement erronées. Ceci représente un gain de temps considérable pour les équipes chargées de leur traitement.
Une aventure collaborative avant tout
Une fois que le périmètre et les hypothèses sont émises en collaboration avec le métier, le défi consiste à construire les jeux de données utilisés par les procédures d'IA. C'est d'ailleurs un exercice important et déterminant pour la suite du processus.
Ensuite, l'objectif est d'élaborer des modèles, d'entraîner l'algorithme et de valider les différents résultats. Cette étape itérative peut être très sensible : les jeux de données et l'algorithme peuvent être revus à tout moment. D'ailleurs, lors de la validation des résultats, les hypothèses de départ peuvent être modifiées et de nouveaux axes d'analyses intégrés. La collaboration entre les intervenants du métier et ceux de l'OCSIN est indispensable pour obtenir des résultats pertinents.
Une fois que les résultats sont validés par le métier, le modèle peut être déployé et utilisé. Tout projet de machine learning peut donner des résultats rapidement.
En conclusion, le machine learning est un outil fantastique, qui offre toute une palette d'opportunités. La qualité des données, les compétences techniques et la connaissance du métier sont les principaux facteurs qui mèneront votre projet au succès.
L'OCSIN recrute !
A l'ère de la transformation numérique, les projets menés par l'Etat nécessitent des connaissances pointues en matière de technologies de l'information. Rejoignez nos équipes.
Cet article a été rédigé par Lionel Jasinski, responsable du secteur ingénierie des données à l'OCSIN.