python pandas kütüphanesi / JFM Python ile Mühendislik Uygulamaları (2–2– 3–6): Pandas

Python Pandas Kütüphanesi

python pandas kütüphanesi

pandas

pandas, veri işlemesi ve analizi için Python programlama dilinde yazılmış olan bir yazılım kütüphanesidir. Bu kütüphane temel olarak zaman etiketli serileri ve sayısal tabloları işlemek için bir veri yapısı oluşturur ve bu şekilde çeşitli işlemler bu veri yapısı üzerinde gerçekleştirilebilir olur. Yazılım ücretsizdir ve bir çeşit BSD ile lisansına sahiptir.[2] Yazılım ismini bir ekonometri terimi olan veri panelinden almıştır. Bir veri paneli birçok zaman aralığı içinde farklı gözlemlerin işlenebildiği yapıyı tarif eder.[3]

Kütüphane özellikleri[değiştir

Pandas, python programlama dilinde veri analizi için kullanılan bir kütüphanedir.

Numpy kütüphanesinde kullandığımız bütün fonksiyonları pandas kütüphanesinde de kullanabiliriz.

Peki o zaman neden numpy kütüphanesini kullanmıyoruz da pandas kütüphanesini kullanıyoruz?

Numpy kütüphanesinin en büyük eksiği sadece aynı türden verileri alabilmesidir. Mesela sayısal bir veri vermişsek bütün verilerin sayısal olarak olması gerekmektedir. Ancak bizim kullandığımız ve gerçek hayatta karşımıza çıkan birçok veri kümesi farklı veri türlerinden oluşmaktadır.

Mesela bir okuldaki öğrencilerin verilerinden oluşan bir veri seti düşünün.

Burada öğrencinin adı(string), boyu(float), memleketi(string), sınıftan geçip kalma durumu(boolean) gibi farklı veri türleri vardır. İşte bu tarz durumlarda numpy kütüphesi ile işlem yapamayız. Bunun yerine pandas kütüphanesini kullanmamız gerekmektedir.

Pandas kütüphanesi ile kolay bir şekilde .csv, .txt, xls gibi dosyalardan veri alabilir bunlar üzerinde istediğimiz manipülasyonu yapabiliriz.

Pandas kütüphanesini kurmak için konsol ekranına aşağıdaki kodu yazmamız ve enter e basmamız yeterlidir.

pip install pandas

Pandas kütüphanesinde temel olarak 2 veri nesnesi bulunur. Bunlar seriler ve veri çerçeveleridir.

1- Seriler(Series)

Numpy dizilerine benzer.

Etiketli verilerdir. Bu yapısı ile bir çeşit sözlük yapısı gibi düşünelebilir. Ancak sözlüklerde arka arkaya gelen veriler seçilemezken serilerde bu yapılabilir.

Seriler Indekslenmiş(sıralanmış) tek boyutlu dizilerdir.

Serileri ouşturmak için liste, sözlük vb. kullanılabilir.

Örnek pandas serisi

import pandas as pd liste=[4,6,7,9,23] pandas_seri= funduszeue.info(liste) print(pandas_seri)

Pandas serilerinde varsayılan olarak index 0 dan başlar. İstersek bunu değiştirebilir veya barklı index numaraları verebiliriz.

import pandas as pd liste=[4,6,7,9,23] pandas_seri= funduszeue.info(liste,index=["a","b","c","d","e"]) print(pandas_seri)

2- Veri Çerçeveleri(DataFrame)

Yukarıda iris(zambak) datasetinden(veri kümesinden) bir örnek görmektesiniz. Pandas kütüphanesinde bu şekilde iki boyutlu verilere DataFrame denmektedir. (Veriler excel tablosu gibidir)

Burada dikkat etmeniz gereken nokta en son sütun(Species). Buradaki veriler string(sözel)veri tipindedir ancak diğer alanlar float(ondalık) veri tipindedir. İşte pandas kütüphanesi ile bu tarz verisetlerinde kolaylıkla işlemler yapabiliriz.

Verilere Nerden Ulaşabilirim?

Günümüzde verilere ulaşmak şu ana kadar hiç olmadığı kadar kolaydır.

Çeşitli web sitelerinden, veritabanlarından, excel tablolarından, metin belgelerinden vb. verilere ulaşabiliriz.

Buralardan verileri nasıl alacağımızı ilerleyen derslerimzde detaylı olarak göreceğiz.

Iris(zambak) Verisetinin Kullanımı

İnternette daha önce oluşturulumuş birçok verisetine ulaşabilirsiniz. (Örneğin: funduszeue.info)

Bu verisetlerinden bazıları eğitim amaçlı kullanılmaktadır. Irıs veriseti de eğitim amaçlı kullanılan bir verisetidir.

Bu setinde tane zambak çiçeğinin taç yaprak boyu ve eni, çanak yaprak boyu ve eni ve zambağın türü bulunmaktadır.

Biz de dersimizde bu verisetini kullanarak verileri üzerinde çeşitli işlemler yapacağız.

Irisİndir

import pandas as pd iris = funduszeue.info_csv("funduszeue.info") print(iris)

Bu şekilde kütüphaneni internetten indirerek kullanabiliriz.

import pandas as pd iris = funduszeue.info_csv("funduszeue.info") #normalde funduszeue.info_csv() dememiz yeterli funduszeue.infos funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info(10) #10 satır göster
import pandas as pd iris = funduszeue.info_csv("funduszeue.info") #normalde funduszeue.info_csv() dememiz yeterli funduszeue.infos funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info(5) #sondan 5 satırı göster.

Bazı önemli fonksiyonlar.

funduszeue.info() #genel bilgi almak için np_dizi=funduszeue.info #pandas numpy tipine çevir funduszeue.info() #veri çerçevesini başka veri çerçevesine aktarmak funduszeue.info() #baştan 5 değer funduszeue.info() #sondan 5 değer funduszeue.infobe() #genel bilgi iris = funduszeue.info_csv("funduszeue.info") funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info[2,"Çanak En"] #2. satırdaki çanak eniris = funduszeue.info_csv("funduszeue.info") funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info[:,"Çanak En"] #bütün satırlarda çanak en

Dataset olarak getirmek için

iris = funduszeue.info_csv("funduszeue.info") funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info[[1]] #1 numaralı
iris = funduszeue.info_csv("funduszeue.info") funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info[[17,18,20]] iris = funduszeue.info_csv("funduszeue.info") funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir funduszeue.info[[17,18,20],[2,3]] #sadece 2 ve 3.sütunlar iris = funduszeue.info_csv("funduszeue.info") funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir iris["fark"]=iris["Taç Boy"]-iris["Taç En"] print(iris)
import pandas as pd iris = funduszeue.info_csv("funduszeue.info") #dosyayı yükle funduszeue.infos=["Taç Boy","Taç En","Çanak Boy","Çanak En","Tür"] #başlıkları değiştir iris["Taç En"] #sütün seçme # tek boyutlu dizi olarak döner. yani series iris[["Taç En"]] #veri çerçevesi olarak gösterir iris[["Taç En","Çanak Boy"]] iris[] #2 ile 5. satır arası #loc - location yani kodum iloc (sayısal konum) integer loc #.index(["abc","def"]) ile satır isimlendirilir. #eğer read_csv() ile okutursak ve satırlar 1. sutündaysa index_col=0 deriz read_csv içine funduszeue.info[2] #2. satırı getirdi. burada satır ismi varsa o da yazılır funduszeue.info[[2]] #dataset olarak gelir funduszeue.info[[2,4]] #2 ve 4. satırı getir. #hisseler['acilis']['ERN'] #satır ve sütün ismine göre #funduszeue.info['ERN'] #yukarıdaki ile aynı funduszeue.info[[2,4],["Çanak Boy","Tür"]] #2 ile 4 arası çanak boy ve tür#numpy formülleri pandas ta da uygulanır import pandas as pd import numpy as np iris = funduszeue.info_csv("funduszeue.info") #normalde funduszeue.info_csv() dememiz yeterli dizi=funduszeue.info[:,[0,1,2,3]] #bütün satır ve 0,1,2,3 sütünlarını seç dizi_log=funduszeue.info(dizi) #logaritmasını al print(dizi_funduszeue.info()) #baştan ilk 5 değer

Seaborn Kütüphanesi

Pythonda eğitim amaçlı verisetlerini indirmek için güzel bir kütüphane vardır. (seaborn)

Seaborn kütüphanesi ile istediğimiz verisetini kolay bir şekilde kullanabiliriz. Bunun için aşağıdaki kodu yazarak kütüphaneyi indiriyoruz.

pip install seaborn

Yukarıdaki kod ile aynı görevi gören aşağıdaki kodu inceleyebilirsiniz.

import seaborn as sns iris=funduszeue.info_dataset('iris') print(iris)

Pandas verilerini istersek numpy dizisine çevirebiliriz.

import seaborn as sns iris=funduszeue.info_dataset('iris') np_dizi=funduszeue.info #numpy dizisine çevir print(np_dizi)

Dataset hakkında genel bir bilgi almak

import seaborn as sns iris=funduszeue.info_dataset('iris') print(funduszeue.infobe)

Sadece 1 sütunun bilgilerini almak

import seaborn as sns iris=funduszeue.info_dataset('iris') iris['species'].describe()

count: uzunluk, unique: birbirinden farklı 3 veri var, top:en çok görünen, freq: kaç gözlem olduğu

Uzunluğunu almak için

import seaborn as sns iris=funduszeue.info_dataset('iris') funduszeue.info()
import seaborn as sns iris=funduszeue.info_dataset('iris') veriler=['petal_length','petal_width'] iris[veriler].count()import seaborn as sns iris=funduszeue.info_dataset('iris') veriler=['petal_length','petal_width'] iris[veriler].mean() #ortalama iris[veriler].std() # standart sapma iris[veriler].median() #ortanca iris[veriler].quantile() #yüzdelik dilimimport seaborn as sns iris=funduszeue.info_dataset('iris') iris['petal_length'].min() iris['petal_length'].max()import seaborn as sns iris=funduszeue.info_dataset('iris') funduszeue.info(axis='columns') #satır bazında hesaplamaimport seaborn as sns iris=funduszeue.info_dataset('iris') kosul=iris['species'] == 'versicolor' type(kosul) kosulimport seaborn as sns iris=funduszeue.info_dataset('iris') kosul=iris['species'] == 'versicolor' versicolor=funduszeue.info[kosul,:] funduszeue.info()import seaborn as sns iris=funduszeue.info_dataset('iris') kosul=iris['species'] == 'versicolor' versicolor=funduszeue.info[kosul,:] funduszeue.infobe()#yukarıdakinin kısa yoldan yapılışı import seaborn as sns iris=funduszeue.info_dataset('iris') iris[iris['species'] == 'versicolor'].describe()#yukarıdakinin değişik yapılışı import seaborn as sns iris=funduszeue.info_dataset('iris') kosul=iris['species']funduszeue.infons('setosa') setosa=iris[kosul] print(funduszeue.info())import seaborn as sns iris=funduszeue.info_dataset('iris') iris[funduszeue.info_length>7]import seaborn as sns iris=funduszeue.info_dataset('iris') iris[(funduszeue.info_length>) & (funduszeue.info_length<)]import seaborn as sns iris=funduszeue.info_dataset('iris') iris[(funduszeue.info_length>)

nest...

çamaşır makinesi ses çıkarması topuz modelleri kapalı huawei hoparlör cızırtı hususi otomobil fiat doblo kurbağalıdere parkı ecele sitem melih gokcek jelibon 9 sınıf 2 dönem 2 yazılı almanca 150 rakı fiyatı 2020 parkour 2d en iyi uçlu kalem markası hangisi doğduğun gün ayın görüntüsü hey ram vasundhara das istanbul anadolu 20 icra dairesi iletişim silifke anamur otobüs grinin 50 tonu türkçe altyazılı bir peri masalı 6. bölüm izle sarayönü imsakiye hamile birinin ruyada bebek emzirdigini gormek eşkiya dünyaya hükümdar olmaz 29 bölüm atv emirgan sahili bordo bereli vs sat akbulut inşaat pendik satılık daire atlas park avm mağazalar bursa erenler hava durumu galleria avm kuaför bandırma edirne arası kaç km prof dr ali akyüz kimdir venom zehirli öfke türkçe dublaj izle 2018 indir a101 cafex kahve beyazlatıcı rize 3 asliye hukuk mahkemesi münazara hakkında bilgi 120 milyon doz diyanet mahrem açıklaması honda cr v modifiye aksesuarları ören örtur evleri iyi akşamlar elle abiye ayakkabı ekmek paparası nasıl yapılır tekirdağ çerkezköy 3 zırhlı tugay dört elle sarılmak anlamı sarayhan çiftehan otel bolu ocakbaşı iletişim kumaş ne ile yapışır başak kar maydonoz destesiyem mp3 indir eklips 3 in 1 fırça seti prof cüneyt özek istanbul kütahya yol güzergahı aski memnu soundtrack selçuk psikoloji taban puanları senfonilerle ilahiler adana mut otobüs gülben ergen hürrem rüyada sakız görmek diyanet pupui petek dinçöz mat ruj tenvin harfleri istanbul kocaeli haritası kolay starbucks kurabiyesi 10 sınıf polinom test pdf arçelik tezgah üstü su arıtma cihazı fiyatları şafi mezhebi cuma namazı nasıl kılınır ruhsal bozukluk için dua pvc iç kapı fiyatları işcep kartsız para çekme vga scart çevirici duyarsızlık sözleri samsung whatsapp konuşarak yazma palio şanzıman arızası

© 2024 Toko Cleax. Seluruh hak cipta.