MI2 DataLab
MI^2 DataLab to miejsce w którym prowadzi się badania związane z rozwojem nowych metod analizy da
MI^2 DataLab to miejsce, w którym prowadzi się badania związane z rozwojem nowych metod analizy danych -
zarówno modelowaniem statystycznym, inżynierią projektów badawczych, uczeniem maszynowym jak i wizualizacją danych. Wynikiem prowadzonych prac są artykuły naukowe lub projekty zrealizowane we współpracy z instytucjami spoza MI^2 (biznes, nauka, przemysł, NGO). Laboratorium powstało we współpracy z firmą Nethone, wchodzącą w skład Grupy Daftcode.
22/04/2022
W MI2DataLab prowadzimy dużo innowacyjnych projektów i bardzo chętnie dzielimy się doświadczeniem z innymi osobami. Idealną okazją do tego jest nasz program praktyk wakacyjnych. W tym roku uczestnicy będą zaangażowani w aktualnie prowadzone projekty pod opieką 6 mentorów.
Praktykanci rozwiną swoje umiejętności progamistyczne i analityczne w projektach badawczych, a przy okazji poznają nasz sposób pracy. Zeszły rok pokazał nam, że z takich dwumiesięcznych intensywnych staży wynikają owocne współprace, które często nie kończą się we wrześniu!
Wszystkie informacje o aplikacji można znaleźć na naszej stronie:
15/04/2022
Obszarem badań grupy MI2DataLab jest odpowiedzialna sztuczna inteligencja (SI). Często mówimy o niej na konferencjach, poświęcamy jej dużo miejsca w książkach, artykułach czy blogach.
Obecnie intensywnie pracujemy nad stworzeniem innowacyjnego, odpowiedzialnego rozwiązania do analizy zdjęć medycznych płuc, które wykorzystuje SI. Celem projektu jest wsparcie pracy radiologów. Nasze badania w tym obszarze są finansowane z grantu NCBiR.
Chcemy się z Wami na bieżąco dzielić zadaniami z jakimi się mierzymy a więc dziś rozpoczynamy serię blogów opisujących nasze prace. Zacznijmy od danych, które są kluczowe przy zadaniach modelowania.
Zapraszamy do lektury!
Towards the largest database of Polish lung medical images AI in healthcare is gaining more at more attention. In MI2DataLab, we work on this area in the project: “xLungs — Responsible Artificial…
14/03/2022
Dziś Dzień Liczby π!
Tak jak zapowiadaliśmy, przed nami kolejna odsłona przygód Bety i Bita. Tym razem opowiadają nam historię o odpowiedzialnym uczeniu maszynowym w książce "Mini Wprowadzenie do Modelowania Predykcyjnego". W naszej siedzibie Przemyslaw Biecek oraz Anna Kozak prezentują najnowsze wydanie w języku polskim, które teraz możecie czytać na okrągło ;) (A obwód koła to 2π, czyli idealnie pasuje do dzisiejszego dnia!)
Chcielibyście mieć papierową wersję w swojej biblioteczce?
Jeżeli tak, to prezentujemy pierwszy sposób, czyli udział w naszym konkursie. Napiszcie w komentarzu, na jaką przygodę chętnie zabralibyście Betę i Bita?
Alterantywnym sposobem jest zakup książki w dobrej księgarni lub przeglądanie jej w wersji online dostępnej w linkach poniżej:
https://betaandbit.github.io/MiniML/
https://www.youtube.com/watch?v=z0mrYZn2M4Q
MiNI Wprowadzenie do Modelowania Predykcyjnego - Unboxing Ta książka splata teorię, przykłady i procesy istotne dla tworzenia modeli zgodnie z regułami Odpowiedzialnego Uczenia Maszynowego (ang. Responsible Machine ...
Zbliżamy się do 14 marca, czyli 3.14 ~ Dzień Liczby Pi!
Mamy dla Was zajawkę tego co wydarzy się już za chwilę, czyli kolejny unboxing!
Nowa ekscytująca przygoda Bety i Bita przed nami..., a o pozostałych przygodach tej dwójki możecie przeczytać w zamieszonych pozycjach na naszej stronie https://www.mi2.ai/beta-bit.html
Do zobaczenia 3,141592! (14 marca o 15:29)
21/01/2022
Jedna z pierwszych papierowych egzemplarzy książki Explanatory Model Analysis Przemysława Biecka oraz Tomasza Burzykowskiego została wystawiona na aukcję wspierającą Wielką Orkiestrę Świątecznej Pomocy.
Książka zawiera zestaw metod i narzędzi zaprojektowanych w celu budowania lepszych modeli predykcyjnych i monitorowania ich zachowania w zmieniającym się środowisku.
Więcej informacji możecie znaleźć na stronie aukcji
Explanatory Model Analysis [WOŚP] Wspomóż 30. Finał - Przejrzyj na oczy! - Wielka Orkiestra Świątecznej Pomocy - zobacz Explanatory Model Analysis [WOŚP] (11695760865) na Allegro
31/12/2021
Dziś ostatni dzień roku 2021, zatem czas na małe podsumowanie!
W tym roku wydarzyło się wiele wspaniałych rzeczy, ciekawe projekty, konferencje oraz publikacje. Nasze podsumowanie roku możecie znaleźć na blogu RML https://medium.com/responsibleml/year-2021-under-the-microscope-78ca19cc1d9
Wszystkiego najlepszego na 2022!
24/12/2021
Dziękujemy Wam, że byliście z nami przez te 24 dni, nie będziemy ukrywać, ale było to dla nas wielkie wyzwanie - dotrwaliśmy ;) Mamy nadzieję, że poznaliście nas lepiej, wiecie czym się zajmujemy i co się u nas dzieje. Dziękujemy za ogrom wsparcia!
W tym roku przygotowaliśmy wyjątkową kartkę świąteczną, zatem chcemy życzyć Wam wszystkiego co najlepsze na ten czas oraz na nadchodzący Nowy Rok 2022!
23/12/2021
Często mówimy o odpowiedzialnym uczeniu maszynowym i o uczciwości modeli, ale nie zapominajmy o pierwszym ważnym kroku zaraz po zbudowaniu modelu. Jakim? Sprawdzeniu jak nasz model dopasował się do danych!
Oczywiście zadbaliśmy o to w 100% i przedstawiamy Wam pakiet auditor, który pozwala na walidację modeli niezależnie czy jest to prosty model regresji czy złożony model oparty na drzewach. Dzięki niemu przeanalizujesz dopasowanie oraz wydajność modelu, wielkość reszt oraz zidentyfikujesz odstające i wypływowe obserwacje. Dużą zaletą pakietu jest posiadanie wizualizacji, które w łatwy sposób pozwalają ocenić poszczególne aspekty naszego modelu.
Autorką rozwiązania jest Alicja Gosiewska.
Więcej o pakiecie auditor:
- https://modeloriented.github.io/auditor/
- https://journal.r-project.org/archive/2019/RJ-2019-036/index.html
22/12/2021
Tworząc rozwiązania XAI musimy brać pod uwagę istniejące regulacje. Jedną z ważniejszych jest rozporządzenie Parlamentu Europejskiego i Rady w sprawie sztucznej inteligencji (Artificial Intelligence Act), które dąży do eliminacji zagrożeń i negatywnych konsekwencji spowodowanych używaniem sztucznej inteligencji. Co zatem należy zrobić, aby odpowiedzialnie trenować sieci neuronowe? Na co należy zwrócić uwagę, aby wytrenowana sieć neuronowa na obrazach płuc rzeczywiście miała szansę pomagać lekarzom?
Nie od dziś pracujemy nad takimi rozwiązaniami, jednym z nich jest przygotowany przez nas artykuł, który analizuje 25 prac klasyfikujących czy zdjęcie płuc przedstawia osobę chorą na COVID-19 oraz czy przy użyciu metod wyjaśnialnej sztucznej inteligencji wskazuje na istotne zmiany chorobowe. Podczas tej analizy zespół znalazł szeregów błędów popełnianych przez twórców modeli i zaproponował jak ich unikać w przyszłości.
Rezultaty tej pracy zostały przedstawione w artykule oraz serii blogów
►https://www.sciencedirect.com/science/article/pii/S0031320321002223
►https://medium.com/responsibleml/check-your-model-checklist-for-responsible-deep-learning-modeling-61a013e50451
21/12/2021
Żeby tworzyć nowe narzędzia i metody cały czas musimy być na bieżąco z najnowszymi pracami publikowanymi na konferencjach i w czasopismach. Idealna okazja ku temu jest na poniedziałkowych seminariach, które są poświęcone tematom ściśle związanym z naszą pracą badawczą. W tym semestrze skupiamy się głównie na dwóch wątkach: wyjaśnialnym uczeniu maszynowym w głębokich sieciach neuronowych oraz automatycznemu budowaniu modeli. Spotkania odbywają się stacjonarnie oraz zdalnie o 10 i są otwarte dla wszystkich. Serdecznie zapraszamy do uczestnictwa. Lista tematów oraz instrukcja jak dołączyć do seminarium jest dostępna pod adresem https://github.com/MI2DataLab/MI2DataLab_Seminarium
20/12/2021
Przedstawiając historię kryjącą się w danych i modelu predykcyjnym, nie wystarczy użyć jednej techniki XAI. Aby odpowiedzialnie wyciągać wnioski musimy spojrzeć na skomplikowane zjawisko z wielu perspektyw.
Dzięki pakietowi modelStudio możemy efektywnie eksplorować różne techniki XAI z pakietu DALEX. W automatyczny sposób budowany jest interaktywny dashboard, dzięki któremu możemy odkrywać interakcje zmiennych i ich wpływ na predykcje. Jeśli jesteśmy świadomi wad i zalet poszczególnych technik XAI możemy także wybrać metody, z których korzystamy. Co ważne, modelStudio nie wymaga serwera, jako plik HTML jest wygodny do przechowywania, współdzielenia i rozszerzania.
Dzięki modelStudio łatwo wyjaśnimy modele machine learning z pakietów R: mlr3, caret, h2o, xgboost, tidymodels, i innych.
Autorem rozwiązania jest Hubert Baniecki.
https://modelstudio.drwhy.ai/
19/12/2021
Prowadzenie zajęć dotyczących wizualizacji danych to nie jedyne zajęcia jakimi się opiekujemy. Ważnym przedmiotem są również Warsztaty Badawcze dla 2 i 3 roku studentów kierunku Inżynieria i Analiza Danych. Są to wyjątkowe zajęcia, ponieważ studenci mogą zobaczyć jak wyglądają artykuły naukowe oraz jak wygląda świat nauki przez pryzmat konferencji i sposobu prezentacji. Nasze zajęcia są o tyle ciekawe, że to studenci mogą wybrać w jakim temacie chcą się rozwijać spośród zaproponowanych. Są one związane z naszą pracą, zatem nie braknie uczenia maszynowego, wyjaśnialnej sztucznej inteligencji, automl, deep learningu czy reprodukowalności wyników.
Studenci nie tylko poznają jak wyglądają artykułu naukowe, ale sami piszą mini artykuł na temat nad którym pracowali. Efektem finalnym jest zbiór takich artykułów w postaci książki online. Poniżej przedstawiamy linki do książek z dwóch ubiegłych edycji i już nie możemy się doczekać nowego semestru, aby znowu rozpocząć tą niezwykle ciekawą przygodę.
► 2020 https://mini-pw.github.io/2020L-WB-Book/
► 2021 https://mini-pw.github.io/2021L-WB-Book/
ML Case Studies Case studies for reproducibility, imputation, and interpretability
Kliknij tutaj, aby odebrać Sponsorowane Ogłoszenie.
Kategoria
Strona Internetowa
Adres
Koszykowa 75
Warsaw
00-662