Naiwny klasyfikator bayesowski

Naiwny klasyfikator bayesowski to prosty klasyfikator oparty na wnioskowaniu statystycznym. Naiwność klasyfikatora przejawia się założeniem niezależności zmiennych losowych reprezentujących cechy klasyfikowanych obiektów, które nie zawsze, a raczej prawie nigdy, nie jest prawdziwe w zagadnieniach rzeczywistych. Popularność naiwnego klasyfikatora bayesowskiego wynika z jego prostoty, zarówno konceptualnej jak i obliczeniowej, która mimo swoich naiwnych założeń często prowadzi do dosyć dobrych wyników.
Czytaj dalej Naiwny klasyfikator bayesowski

Algorytm EM

Algorytm Expectation–Maximization (algorytm EM) to metoda estymacji parametrów modelu probabilistycznego ze zmiennymi ukrytymi polegająca na iteracyjnej maksymalizacji funkcji wiarygodności. Każda iteracja algorytmu EM składa się z dwóch kroków: kroku E, w którym wyznaczana jest wartość oczekiwana logarytmicznej funkcji wiarygodności w oparciu o aktualne wartości parametrów modelu, oraz kroku M, w którym wyznaczane są wartości parametrów modelu maksymalizujące aktualnie wyznaczoną wartość oczekiwaną logarytmicznej funkcji wiarygodności.
Czytaj dalej Algorytm EM

Analiza danych w Python Pandas

Jednym z podstawowych pakietów do analizy danych w języku Python jest pakiet Pandas. Artykuł przedstawia podstawowe operacje związane z analizą danych za pomocą funkcji dostępnych w pakiecie Pandas. W artykule umieściłem przykłady związane z analizą danych w Python Pandas dotyczących cen samochodów z ogłoszeń motoryzacyjnych, które ilustrują podstawowe operacje wykonywane na danych przy użyciu pakietu Pandas. Artykuł jest przeznaczony dla osób początkujących, które rozpoczynają prace z analizą danych w języku Python i nie znają jeszcze funkcjonalności pakietu Pandas.
Czytaj dalej Analiza danych w Python Pandas

System informacji przestrzennej w Python i GeoPandas

System informacji przestrzennej, określany skrótem GIS od angielskiego Geographic Information System, może być tworzony w języku Python z pakietem GeoPandas, który jest rozszerzeniem popularnego pakietu Pandas. Pakiet GeoPandas umożliwia przetwarzanie danych przestrzennych i przetwarzanie danych geograficznych w języku Python w bardzo wygodny sposób, podobny do przetwarzania danych relacyjnych w pakiecie Pandas lub w języku SQL. Czytaj dalej System informacji przestrzennej w Python i GeoPandas

Trend szeregu czasowego

Trend szeregu czasowego zawiera podstawowe informacje o zjawisku opisywanym przez rozpatrywany szereg czasowy. Artykuł pokazuje jak wykorzystać język Python i pakiet Pandas do wyznaczania trendów szeregów czasowych. Jest kontynuacją poprzedniego artykułu o podstawowych operacjach na szeregach czasowych w języku Python z pakietem Pandas dostępnego tutaj.
Czytaj dalej Trend szeregu czasowego

Szeregi czasowe i Python Pandas

Szeregi czasowe mogą być wygodnie przetwarzane w języku Python dzięki narzędziom dostępnym w pakiecie Pandas. W artykule przedstawiam przykład ilustrujący wykorzystanie języka Python i biblioteki Pandas do prostych operacji na szeregach czasowych. Artykuł jest przeznaczony dla osób początkujących, które nie mają jeszcze większego doświadczenia z przetwarzaniem szeregów czasowych w języku Python, ale znają podstawy samego języka programowania.
Czytaj dalej Szeregi czasowe i Python Pandas

Klasyfikacja danych

Artykuł dotyczy klasyfikacji danych, która jest metodą eksploracji danych (ang. data mining) często realizowaną algorytmami inteligencji obliczeniowej. Przeznaczony jest dla osób początkujących, które nie mają jeszcze większego doświadczenia z inżynierią danych.
Czytaj dalej Klasyfikacja danych

Regresja liniowa

Artykuł dotyczy regresji liniowej, która jest metodą statystyki matematycznej leżącą u podstaw wielu algorytmów inteligencji obliczeniowej. Przeznaczony jest dla osób początkujących, które nie mają jeszcze większego doświadczenia z inteligencją obliczeniową.
Czytaj dalej Regresja liniowa