Ten dzień poświęcony jest utrwaleniu wiedzy zdobytej przez cały tydzień nauki Pythona dla nauki o danych. Dokładnie przejrzymy materiał, przećwiczymy zadania i zaplanujemy dalszą drogę edukacji, aby efektywnie rozwijać umiejętności.
Przez ten tydzień przeszliśmy przez wiele zagadnień. Zaczęliśmy od podstaw Pythona, takich jak zmienne, typy danych, operatory i struktury kontrolne (pętle, warunki). Następnie przeszliśmy do pracy z listami, słownikami i funkcjami. Kolejnym krokiem było wprowadzenie biblioteki Pandas do analizy danych, gdzie uczyliśmy się wczytywać, manipulować i analizować dane. Uczyliśmy się wizualizować dane za pomocą biblioteki Matplotlib. Wreszcie, zagłębiliśmy się w podstawy NumPy, która jest kluczowa dla efektywnej pracy z danymi liczbowymi. Przyjrzyjmy się krótko kluczowym elementom każdego dnia.
Pamiętasz, jak definiuje się zmienne? Jakie są podstawowe typy danych? Jak działają operatory logiczne i arytmetyczne? Jak tworzyć pętle for
i while
? Spróbuj przypomnieć sobie te pojęcia na przykładach.
Przykład:
# Zmienna przechowująca wiek
wiek = 30
# Typ danych (integer - liczba całkowita)
print(type(wiek))
# Pętla for iterująca po liście
owoce = ['jabłko', 'banan', 'pomarańcza']
for owoc in owoce:
print(f'Lubię {owoc}')
Pamiętaj o strukturach warunkowych if
, elif
i else
do podejmowania decyzji w kodzie.
Listy są uporządkowanymi kolekcjami danych, a słowniki przechowują dane w parach klucz-wartość. Funkcje pozwalają na wielokrotne wykorzystywanie kodu.
Przykład:
# Lista liczb
liczby = [1, 2, 3, 4, 5]
print(liczby[0]) # Wyświetla pierwszy element (indeks 0)
# Słownik przechowujący informacje o osobie
osoba = {"imię": "Anna", "wiek": 28, "zawód": "programista"}
print(osoba["imię"])
# Definicja funkcji
def powitaj(imie):
return f"Cześć, {imie}!"
print(powitaj("Jan"))
Biblioteka Pandas to potężne narzędzie do analizy danych. Pozwala na wczytywanie danych z różnych źródeł (CSV, Excel), czyszczenie i manipulację danymi (filtrowanie, sortowanie, dodawanie kolumn) oraz podstawowe statystyki. Pamiętasz, jak wczytać plik CSV do DataFrame? Jak wyświetlić kilka pierwszych wierszy? Jak obliczyć średnią wartość kolumny?
Przykład:
import pandas as pd
# Wczytywanie pliku CSV
data = pd.read_csv('dane.csv')
# Wyświetlanie pierwszych 5 wierszy
print(data.head())
# Obliczanie średniej wieku
srednia_wieku = data['wiek'].mean()
print(f'Średnia wieku: {srednia_wieku}')
Matplotlib to biblioteka do tworzenia wykresów. Uczyłeś się tworzyć wykresy liniowe, słupkowe, rozrzutu i kołowe. Pamiętasz, jak dodawać tytuły, etykiety osi i legendy?
Przykład:
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 5]
plt.plot(x, y)
plt.title('Prosty Wykres Liniowy')
plt.xlabel('Oś X')
plt.ylabel('Oś Y')
plt.show()
NumPy to biblioteka do szybkiej pracy z tablicami i macierzami. Pozwala na efektywne operacje matematyczne. Pamiętasz, jak tworzyć tablice NumPy? Jak obliczać sumę elementów tablicy? Jak wykonywać operacje na tablicach?
Przykład:
import numpy as np
# Tworzenie tablicy NumPy
tablica = np.array([1, 2, 3, 4, 5])
# Obliczanie sumy elementów
suma = np.sum(tablica)
print(f'Suma: {suma}')
# Dodawanie do każdego elementu tablicy
nowa_tablica = tablica + 5
print(nowa_tablica)
Teraz, kiedy masz solidne podstawy, czas zaplanować kolejne kroki.
* Scikit-learn: Biblioteka do uczenia maszynowego. Umożliwia budowanie modeli predykcyjnych. Zaczniemy od uczenia nadzorowanego (regresja, klasyfikacja), a potem przejdziemy do nienadzorowanego (klasteryzacja, redukcja wymiarowości).
* Seaborn: Biblioteka do zaawansowanej wizualizacji danych, która buduje na Matplotlib, oferując piękniejsze i bardziej informatywne wykresy. Pozwoli ci na jeszcze lepsze prezentowanie wyników analizy danych.
Projekty:* Buduj własne projekty, aby utrwalić wiedzę i zbudować portfolio. Możesz analizować dane z otwartych źródeł (np. dane pogodowe, dane finansowe) lub stworzyć własne zestawy danych (np. dotyczące Twoich nawyków).
Explore advanced insights, examples, and bonus exercises to deepen understanding.
Witaj! Ten dzień to nie tylko powtórka, ale również okazja do pogłębienia wiedzy, spojrzenia na Python dla nauki o danych z innej perspektywy i zaplanowania ekscytującej podróży w przyszłość. Przygotuj się na wyzwania i inspiracje!
Dotychczas skupiliśmy się na fundamentach. Teraz spojrzymy na kilka aspektów, które mogą znacznie podnieść efektywność Twojej pracy.
flake8
lub pylint
do automatycznej weryfikacji kodu.
cProfile
lub line_profiler
, aby identyfikować wąskie gardła.
Sprawdź swoje umiejętności, rozwiązując poniższe zadania:
Masz dane o sprzedaży (np. w pliku CSV). Wykorzystaj Pandas do:
Napisz funkcję w Pythonie, która oblicza medianę, kwartyl pierwszy i trzeci dla podanej listy liczb. Przetestuj ją na różnych danych, w tym na danych z błędami (brakujące wartości, itp.).
Python i nauka o danych są obecne w wielu branżach. Oto kilka przykładów:
Spróbuj stworzyć prosty model klasyfikacji (np. rozpoznawanie cyfr z obrazów) przy użyciu biblioteki scikit-learn. Wykorzystaj gotowy zbiór danych, np. MNIST (dostępny w scikit-learn). Sprawdź różne algorytmy klasyfikacji (np. SVM, Drzewa Decyzyjne) i oceń ich skuteczność. Zastanów się, jak można zoptymalizować proces uczenia.
Twoja przygoda z Pythonem i nauką o danych dopiero się zaczyna! Rozważ następujące tematy:
Pamiętaj, najważniejsze jest regularne ćwiczenie i eksperymentowanie. Szukaj projektów, które Cię interesują, i próbuj je zrealizować. Powodzenia! A może zainspiruje Cię jakaś polska firma, która ma ogromne zapotrzebowanie na analityków danych?
Wczytaj plik `dane.csv` (jeśli go nie masz, stwórz prosty plik CSV z danymi np. o osobach: imię, wiek, zarobki). Oblicz średni wiek i wyświetl 5 najstarszych osób. Spróbuj użyć metody `sort_values()`.
Stwórz wykres liniowy przedstawiający zmiany temperatury w ciągu tygodnia (dane wymyśl lub użyj danych z zewnętrznego źródła). Oznacz osie i dodaj tytuł wykresu. Dodaj drugi wykres słupkowy z danymi sprzedaży w tym samym okresie. Użyj subplotów ( `plt.subplot()` lub `plt.subplots()` ).
Przejrzyj swój kod z całego tygodnia. Zastanów się, które zagadnienia były najtrudniejsze, a które najłatwiejsze. Jakie masz mocne i słabe strony? Co chcesz poprawić w następnym tygodniu?
Na kartce lub w pliku tekstowym, zapisz swoje cele na kolejne tygodnie. Co chcesz osiągnąć? Jakie tematy chcesz zgłębić? Jakie projekty chcesz zrealizować (np. analiza danych z Twittera, analiza cen mieszkań, analiza danych dotyczących sprzedaży w sklepie)?
Wyobraź sobie, że pracujesz jako analityk danych w małej firmie e-commerce. Twoim zadaniem jest analiza danych sprzedażowych z ostatnich sześciu miesięcy. Użyj tego, czego się nauczyłeś, aby: 1) Wczytać dane z pliku CSV. 2) Sprawdzić braki danych i je uzupełnić. 3) Obliczyć miesięczny przychód i zysk. 4) Stworzyć wykres liniowy, który pokaże trendy sprzedaży. 5) Przygotować raport z wynikami analizy dla zarządu.
Przed następną lekcją przygotuj się na wprowadzenie do uczenia maszynowego z biblioteką scikit-learn. Przejrzyj dokumentację scikit-learn (oficjalna strona lub inne źródła) i zapoznaj się z podstawowymi pojęciami związanymi z uczeniem maszynowym (uczenie nadzorowane, nienadzorowane, modele). Zastanów się, jakie zadania uczenia maszynowego Cię interesują najbardziej (np. klasyfikacja obrazów, przewidywanie cen mieszkań).
We're automatically tracking your progress. Sign up for free to keep your learning paths forever and unlock advanced features like detailed analytics and personalized recommendations.