W dzisiejszej lekcji zapoznasz się z fascynującym światem Data Science i jego fundamentalnym narzędziem: językiem Python. Nauczysz się podstaw Pythona, niezbędnych do przetwarzania danych i przygotujesz się do bardziej zaawansowanych analiz i modelowania.
Data Science to interdyscyplinarna dziedzina, która wykorzystuje metody naukowe, procesy, algorytmy i systemy do wyciągania wiedzy i wniosków z danych, zarówno ustrukturyzowanych jak i nieustrukturyzowanych. Obejmuje analizę danych, uczenie maszynowe, wizualizację danych i wiele innych obszarów. Data Science jest kluczowa w wielu branżach, od finansów i marketingu po medycynę i transport. Wyobraź sobie, że analizujesz ruch w godzinach szczytu w Warszawie, by zoptymalizować komunikację miejską, albo analizujesz dane pacjentów by wcześnie wykrywać choroby. To właśnie Data Science w działaniu!
Python to popularny język programowania, idealny dla początkujących Data Scientistów. Jest łatwy w nauce i ma ogromną bibliotekę narzędzi do analizy danych.
Zmienne: Zmienne to nazwane miejsca w pamięci, w których przechowujemy dane. Możesz myśleć o nich jak o pudełkach z etykietami.
# Przykłady zmiennych
nazwa = "Jan Kowalski" # Ciąg znaków (string)
wiek = 30 # Liczba całkowita (integer)
wzrost = 1.75 # Liczba zmiennoprzecinkowa (float)
zatrudniony = True # Wartość logiczna (boolean)
Typy Danych:
* str
(string): Tekst, np. "Witaj Świecie!"
* int
(integer): Liczby całkowite, np. 10, -5, 0
* float
: Liczby zmiennoprzecinkowe, np. 3.14, -2.5
* bool
(boolean): Wartości logiczne, True
(prawda) lub False
(fałsz)
Przykłady:
pole = 3.14 * 5**2 # Obliczanie pola koła (wykładnik to **)
print(pole) # Wyświetli wynik
W Pythonie możemy wykonywać operacje matematyczne i manipulować ciągami znaków.
Operacje matematyczne:
* +
(dodawanie), -
(odejmowanie), *
(mnożenie), /
(dzielenie), **
(potęgowanie), %
(modulo - reszta z dzielenia)
liczba1 = 10
liczba2 = 3
wynik = liczba1 + liczba2 # wynik będzie równy 13
reszta = liczba1 % liczba2 # reszta będzie równa 1
Operacje na ciągach znaków:
* Łączenie (konkatenacja): +
* Długość ciągu: len()
* Formatowanie (np. f-string
):
tekst1 = "Ala ma "
tekst2 = "kota."
zlaczone = tekst1 + tekst2 # zlaczone będzie równe "Ala ma kota."
dl_tekstu = len(zlaczone) # dl_tekstu będzie równe 12
# Formatowanie
imie = "Jan"
wiek = 30
tekst = f"Mam na imię {imie} i mam {wiek} lat."
print(tekst)
Listy to uporządkowane kolekcje elementów. Pętle pozwalają powtarzać pewne bloki kodu. To podstawowe narzędzia do pracy z danymi.
Listy:
lista_owocow = ["jabłko", "banan", "pomarańcza"]
print(lista_owocow[0]) # wyświetli "jabłko" (indeksy zaczynają się od 0)
lista_liczb = [1, 2, 3, 4, 5]
Pętle for
:
for owoc in lista_owocow:
print(owoc)
for liczba in lista_liczb:
print(liczba * 2) # Pomnoży każdą liczbę przez 2
Funkcje to bloki kodu, które wykonują określone zadania. Ułatwiają organizację i ponowne wykorzystywanie kodu.
def oblicz_kwadrat(liczba):
wynik = liczba * liczba
return wynik
wynik_kwadratu = oblicz_kwadrat(5) # wynik_kwadratu będzie równy 25
print(wynik_kwadratu)
def powitanie(imie):
print(f"Witaj, {imie}!")
powitanie("Maria") # Wyświetli "Witaj, Maria!"
Explore advanced insights, examples, and bonus exercises to deepen understanding.
Wspaniale! Już poznałeś/aś podstawy Pythona i dowiedziałeś/aś się, jak wprowadzają one do świata Data Science. Teraz zagłębimy się jeszcze bardziej w fascynujący świat danych, modelowania i uczenia maszynowego, rozszerzając Twoją wiedzę i umiejętności.
Typy Danych: Pamiętaj, że Python jest językiem dynamicznie typowanym. Oznacza to, że typ danych zmiennej jest określany w momencie przypisania, a nie deklaracji. Daje to dużą elastyczność, ale wymaga uważności. Zwróć uwagę na konwersję typów danych, na przykład, gdy dzielisz dwie liczby całkowite (int
), a Python domyślnie zwraca wynik jako liczbę zmiennoprzecinkową (float
).
a = 10
b = 3
wynik = a / b # wynik to 3.3333... (float)
print(type(wynik)) #
Operatory i Priorytety: Oprócz podstawowych operatorów arytmetycznych (+, -, *, /), Python oferuje również operator modulo (%
– reszta z dzielenia) oraz operator potęgowania (**
). Pamiętaj o priorytetach operatorów (PEMDAS/BODMAS - nawiasy, potęgowanie, mnożenie/dzielenie, dodawanie/odejmowanie) - to kluczowe dla poprawnego działania kodu!
x = 2 + 3 * 4 # x = 14 (mnożenie przed dodawaniem)
y = (2 + 3) * 4 # y = 20 (nawiasy mają priorytet)
z = 7 % 2 # z = 1 (reszta z dzielenia 7 przez 2)
Listy vs. Krotki: Listy (list
) są zmienne (mutable), tzn. możesz modyfikować ich zawartość po utworzeniu. Krotki (tuple
) są niezmienne (immutable) i używane do przechowywania danych, które nie powinny się zmieniać. Krotki są szybsze i bardziej oszczędne pod względem pamięci.
lista = [1, 2, 3]
lista.append(4) # lista to [1, 2, 3, 4]
krotka = (1, 2, 3)
# krotka.append(4) # Błąd! Krotki są niezmienne.
Ćwiczenia te pomogą Ci utrwalić zdobytą wiedzę.
# Przykład (wypełnij kod)
rok_urodzenia = int(input("Podaj rok urodzenia: "))
aktualny_rok = 2024 # Załóżmy, że to aktualny rok
wiek = aktualny_rok - rok_urodzenia
print("Twój wiek to:", wiek, "lat")
# Przykład (wypełnij kod)
imie = input("Podaj imię: ")
nazwisko = input("Podaj nazwisko: ")
print(nazwisko + ", " + imie)
# Przykład (wypełnij kod)
lista_zakupow = []
while True:
produkt = input("Dodaj produkt do listy (lub wpisz 'koniec'): ")
if produkt.lower() == 'koniec':
break
lista_zakupow.append(produkt)
print("Twoja lista zakupów:", lista_zakupow)
Analiza Danych Finansowych: Python, z wykorzystaniem bibliotek takich jak pandas
i numpy
(które poznasz później), jest szeroko stosowany do analizy danych finansowych. Na przykład, możesz analizować kursy walut, ceny akcji, lub tworzyć modele predykcyjne dotyczące trendów rynkowych.
Automatyzacja Zadań: Python jest doskonałym narzędziem do automatyzacji powtarzalnych zadań. Na przykład, możesz napisać skrypt, który automatycznie pobiera i przetwarza dane z plików CSV, tworząc raporty i analizy. To bardzo przydatne w wielu branżach, od marketingu po logistykę.
Nauka w Polsce: Wykorzystaj Python do analizy danych z GUS (Główny Urząd Statystyczny) lub danych szkolnych - np. ocen uczniów, frekwencji. Możesz budować proste wizualizacje danych za pomocą bibliotek takich jak matplotlib
. To świetny sposób, by połączyć naukę programowania z praktycznym zastosowaniem.
Tworzenie Kalkulatora: Spróbuj stworzyć prosty kalkulator, który potrafi wykonywać podstawowe operacje arytmetyczne (dodawanie, odejmowanie, mnożenie, dzielenie) i potrafi obsłużyć błędy (np. dzielenie przez zero). Wykorzystaj funkcję input()
do pobierania danych od użytkownika i if/else
do obsługi operacji. Zadbaj o estetykę kodu.
pandas
(do analizy danych) i matplotlib
(do wizualizacji danych).for
, while
) i instrukcje warunkowe (if
, elif
, else
) - są fundamentalne w programowaniu.Napisz program, który oblicza obwód i pole prostokąta. Użyj zmiennych dla długości i szerokości, a następnie wyświetl wyniki.
Stwórz zmienne dla imienia, wieku i miasta. Następnie użyj formatowania stringów (f-string) aby stworzyć zdanie typu: "Nazywam się [imię], mam [wiek] lat i mieszkam w [miasto]."
Stwórz listę 5 ulubionych potraw. Użyj pętli `for` aby wydrukować każdą potrawę z listy.
Napisz funkcję, która przyjmuje jako argument temperaturę w stopniach Celsjusza i zwraca temperaturę w stopniach Fahrenheita. Wywołaj funkcję z przykładową temperaturą.
Wyobraź sobie, że chcesz przeanalizować dane z ankiety, w której pytano o ulubione kolory. Wykorzystując to, czego się dzisiaj nauczyłeś, możesz stworzyć listę ulubionych kolorów respondentów, a następnie użyć pętli `for` aby policzyć, ile razy każdy kolor się pojawia. To prosty początek analizy danych!
Przygotuj się na następną lekcję: zainstaluj środowisko programistyczne (np. Anaconda) i zapoznaj się z bibliotekami takimi jak `numpy` i `pandas`, które ułatwią pracę z danymi. Przeanalizuj i poszukaj gotowych kodów na przykładzie popularnych problemów Data Science (np. klasyfikacja iris, analiza cen nieruchomości).
We're automatically tracking your progress. Sign up for free to keep your learning paths forever and unlock advanced features like detailed analytics and personalized recommendations.