Dzisiaj zagłębimy się w dwa kluczowe narzędzia dla każdego Data Scientista: biblioteki NumPy i Matplotlib. Nauczymy się, jak efektywnie manipulować danymi numerycznymi i wizualizować je, co stanowi fundament każdego projektu związanego z głębokim uczeniem.
NumPy (Numerical Python) to podstawowa biblioteka w Pythonie dla obliczeń numerycznych. Centralnym elementem NumPy jest obiekt ndarray
, czyli wielowymiarowa tablica. To właśnie na niej będziemy wykonywać większość naszych operacji. Zamiast operować na listach Pythona, NumPy pozwala na znacznie szybsze i efektywniejsze obliczenia, szczególnie w przypadku dużych zbiorów danych.
Tworzenie tablic NumPy:
import numpy as np
# Z listy:
lista = [1, 2, 3, 4, 5]
tablica = np.array(lista)
print(tablica)
# Z zakresu:
tablica_zakres = np.arange(0, 10, 2) # od 0 do 10 (nie włącznie), co 2
print(tablica_zakres)
# Z zerami:
tablica_z_zerami = np.zeros((2, 3)) # tablica 2x3 wypełniona zerami
print(tablica_z_zerami)
# Z jedynkami:
tablica_z_jedynkami = np.ones((3, 3))
print(tablica_z_jedynkami)
Podstawowe operacje na tablicach:
# Dodawanie:
tablica1 = np.array([1, 2, 3])
tablica2 = np.array([4, 5, 6])
wynik_dodawania = tablica1 + tablica2
print(wynik_dodawania)
# Mnożenie przez skalar:
tablica = np.array([1, 2, 3])
wynik_mnozenia = tablica * 2
print(wynik_mnozenia)
# Operacje element po elemencie:
tablica = np.array([1, 2, 3])
wynik_kwadratu = tablica ** 2
print(wynik_kwadratu)
W głębokim uczeniu często będziemy pracować z danymi w postaci wielowymiarowych tablic (np. obrazy jako tablice pikseli). NumPy umożliwia efektywne operacje na takich danych.
Tworzenie tablic wielowymiarowych:
import numpy as np
tablica_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(tablica_2d)
print(tablica_2d.shape) # Wyświetla rozmiar tablicy (wiersze, kolumny)
Indeksowanie i Wycinanie (Slicing):
# Dostęp do elementu:
element = tablica_2d[0, 1] # element z pierwszego wiersza, drugiej kolumny
print(element)
# Wycinanie wierszy:
wiersze = tablica_2d[0:2, :] # dwa pierwsze wiersze, wszystkie kolumny
print(wiersze)
# Wycinanie kolumn:
kolumny = tablica_2d[:, 0:2] # wszystkie wiersze, dwie pierwsze kolumny
print(kolumny)
Matplotlib to biblioteka do tworzenia wykresów i wizualizacji danych. Jest niezbędna do analizy danych i prezentacji wyników. Używamy jej do tworzenia wykresów liniowych, punktowych, słupkowych, histogramów i wielu innych.
import matplotlib.pyplot as plt
# Wykres liniowy:
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 1, 3, 5])
plt.plot(x, y) # tworzy wykres
plt.title("Prosty Wykres")
plt.xlabel("Oś X")
plt.ylabel("Oś Y")
plt.show() # wyświetla wykres
# Wykres punktowy:
plt.scatter(x, y)
plt.title("Wykres Punktowy")
plt.xlabel("Oś X")
plt.ylabel("Oś Y")
plt.show()
Dodatkowe funkcje Matplotlib:
plt.title()
: Dodaje tytuł do wykresu.plt.xlabel()
: Dodaje etykietę do osi X.plt.ylabel()
: Dodaje etykietę do osi Y.plt.legend()
: Dodaje legendę do wykresu (jeśli mamy kilka serii danych).plt.grid()
: Dodaje siatkę do wykresu.Explore advanced insights, examples, and bonus exercises to deepen understanding.
Wczoraj poznaliśmy podstawy bibliotek NumPy i Matplotlib. Dowiedzieliśmy się, jak manipulować danymi numerycznymi za pomocą tablic NumPy i jak je wizualizować za pomocą Matplotlib. Dziś pogłębimy naszą wiedzę, aby jeszcze lepiej przygotować się do świata Data Science!
NumPy oferuje o wiele więcej niż tylko podstawowe operacje arytmetyczne. Pomyśl o takich funkcjach, jak:
np.sin()
, np.cos()
.Matplotlib to nie tylko linia prosta. Rozważ:
Stwórz tablicę NumPy o wymiarach (3, 4) wypełnioną losowymi liczbami całkowitymi. Dodaj do niej skalar 5. Jak wygląda wynik? Spróbuj dodać wektor o wymiarach (1, 4). Wyjaśnij, co się dzieje.
Podpowiedź: Użyj np.random.randint()
do generowania liczb losowych.
Utwórz tablicę NumPy z 100 losowymi liczbami z rozkładu normalnego. Zastosuj maskę, aby wybrać tylko te elementy, które są większe niż 0. Wyświetl te elementy. Oblicz średnią wartość tych elementów.
Podpowiedź: Użyj np.random.normal()
i operatorów porównania.
Umiejętności zdobyte dzisiaj znajdują zastosowanie w wielu obszarach:
Spróbuj następującego wyzwania:
Kontynuuj eksplorację tych tematów:
Stwórz tablicę NumPy z liczbami od 1 do 10. Następnie pomnóż wszystkie elementy tablicy przez 3. Wypisz wynik na ekran.
Stwórz tablicę 3x3 wypełnioną losowymi liczbami. Wyciągnij z niej: a) pierwszy wiersz, b) drugą kolumnę. Wyświetl wyniki.
Wykorzystując NumPy, stwórz dwie tablice: x zawierającą liczby od 0 do 10, y zawierającą kwadraty tych liczb. Narysuj wykres liniowy tych danych za pomocą Matplotlib. Dodaj tytuł wykresu i etykiety osi.
Wyobraź sobie, że jesteś analitykiem danych w małej firmie e-commerce. Masz dane dotyczące liczby sprzedanych produktów w każdym miesiącu przez ostatni rok. Wykorzystaj NumPy do obliczenia średniej miesięcznej sprzedaży i Matplotlib do wizualizacji danych, np. w postaci wykresu liniowego.
Przed następną lekcją przygotuj się na poznanie biblioteki Pandas, która ułatwia zarządzanie i analizę danych w bardziej zaawansowany sposób. Przejrzyj dokumentację Pandas, żeby się z nią zapoznać.
We're automatically tracking your progress. Sign up for free to keep your learning paths forever and unlock advanced features like detailed analytics and personalized recommendations.