This article is about my practice on the Kaggle imbalanced dataset — Credit Card Fraud Detection.

Import packages

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.preprocessing import RobustScalerfrom sklearn.model_selection import StratifiedKFold
from sklearn.model_selection import GridSearchCV
from sklearn.linear_model import LogisticRegressionfrom imblearn.under_sampling import NearMiss
from imblearn.under_sampling import RandomUnderSampler
from imblearn.over_sampling import SMOTEfrom sklearn.metrics import confusion_matrix, classification_report, roc_auc_score

Simple EDA

Import data

all_data = pd.read_csv(‘creditcard.csv’)
all_data.shape

Output

(284807, 31)

Inspect the columns

all_data.columns

Output

Index(['Time', 'V1', 'V2', 'V3', 'V4', 'V5', 'V6', 'V7', 'V8', 'V9', 'V10','V11', 'V12', 'V13', 'V14', 'V15', 'V16', 'V17', 'V18', 'V19', 'V20','V21', 'V22', 'V23', 'V24', 'V25', 'V26', 'V27', 'V28', 'Amount','Class'], dtype='object')


This article is about my lecture note from this course and some implementation of idea.

Lecture note: Graphical exploratory data analysis

In this part of course, it introduces three commonly-used plot in data visualization:

1. Histogram

The data is from 2008 US swing state election results

By the histogram above we can easily tell that Barack Obama got less than 50 percent of vote of the majority counties in swing states.

However, there are two drawbacks while using histogram:

  • Binning bias: the same data may be interpreted differently depending on choice of bins


每年的六月到十月,是巴拉望的雨季,也是颱風的旺季,如果同時遇上,也只能在飯店耍廢了,出發前我給自己這樣的心理建設。

一整排的(雷)陣雨是我們造訪當周的天氣預報,忐忑之餘,也只能硬著頭皮上了,祈求都是午後陣雨,不要影響到行程。

Day 2

這天的行程重點是拜訪新世界七大奇景之一的地底河流(underground river),從普林賽薩港(A點)搭乘van到地底河流(B點)約需要2個小時,整個行程被當地旅行社包好好,包括車資、船資、午餐、導遊費等等,一人要價1700披索。

這可以說是來巴拉望必去的景點,各國觀光客趨之若鶩,跟我們搭乘同一輛van上就有來自英國、波蘭、德國、菲律賓本島等國家。

地圖上藍色路線剛好涵蓋了島上往返這三地的公路,旅遊期間如果你覺得這條公路的品質很差,那身為過來人的我建議你不要出門了,因為這是島上最好的路。要懂得知足阿,少年仔XD


二十歲的暑假,以這種年紀第一次踏上台灣以外的土地,感覺格外特別。

為什麼會選擇菲律賓當作第一次呢?

答案很簡單 : 便宜,而且,聽說國外海水比較藍 ,哈,喜歡海的我,當然是立馬選擇海島國家。

我不喜歡跟團,花費較貴,行程的自由度不高,幫你排好好,少了一種冒險的感覺,而且去的都是觀光客行程,人滿為患。

現在網路真的很方便,想要的資訊都有,因此就決定自由行了。

做功課的途中,隱隱約約發現用中文搜尋跑出來的,大部分都是標準觀光客行程,哈 ,如果想找秘境,比較少人去的,還是用英文吧,國外的網站總是充滿驚喜,相信我。

這次的唯一旅伴土魚十分信任我,行程全權交給我負責,他負責考期末考。

出發

途中看到的山,一枝獨秀,很特別

凌晨三點的紅眼班機,我十點多就到了機場,在第一航廈自個兒亂繞,這時看到宿霧航空櫃台前有對中年夫妻,心想也是無聊的很,於是上前搭話。

一問之下原來也是要去巴拉望,是跟旅行社訂的行程,直飛公主港(註一),二萬五,五天。

我心想我玩八天,大概估一下也才花個兩萬三四,賺!

加上轉機時間,到公主港已經上午十一點多,第一次搭飛機,光是看窗外的景色就讓我興奮的睡不著。

大片大片各種形狀的雲搭配藍藍的海一起服用,心中已經有了小小的感動,好美呀,值了!

一路上的忐忑和興奮,搞得我幾乎沒睡就開始第一天的行程。

Day 1

一出機場,就看到當地特有的交通工具:三輪車(tricycle),一排排的等著載客,這是當地最常見的短程交通運輸工具,時速不快,跟司機講好目的地之後,現場談價錢(可以殺價),談妥後即出發。

然而,可別以為只有這樣,這些tricycle司機通常都會跟當地的旅行社合作,搭車的路上會跟你推銷他們的套裝行程,我們想說第一天就把八天的行程談妥,於是就被司機載去旅行社了...

不過我的建議是,在哪邊玩,就跟哪邊的當地旅行社談,不太建議在公主港談妥愛尼島的行程,因為兩地差了兩三百公里,出狀況的話不方便聯繫。

第一天的行程是公主港的city tour,一個標準的觀光客行程,哈。

藍色教堂、鱷魚園、蝴蝶園、麵包山、baywalk。


這天又是跳島... 老實說開始有點膩了,石灰岩壁,穿插在海中的小島....然後天氣也越來越差,後來想想規劃個七天左右的行程才是最剛好的。

剛出海的時候浪還沒有很大,之後越來越不對勁,大雨下個不停,船在大浪中顯得脆弱不堪,浪一直飛過甲板與乘客撞擊,讓坐在船頭的我還沒下水全身已經濕透...。

天氣大概長這樣

那時候滿腦子在想我的生命會不會止於此...

Day 7

今天跳島行程莫名其妙變成Tour A+B,之前A的部分我們已經玩過,這裡只介紹B。

Snake Island

顧名思義,蛇島就是一個像蛇的沙洲,把海分開,走在沙灘上兩邊都是海的感覺挺特別的。沙洲附近有個高地,大約走五分鐘的階梯就可以到制高點,右下圖就是在那裏照的。


這幾天我們一直詢問愛尼島當地的旅行社,有哪裡好玩的。

:Have you been to XXX waterfall?

:Yes。

How about XXX beach?

:Yes。

詢問幾次之後我們放棄了,愛尼島除了沒玩過的跳島行程,該去的都去過了。我們只好把目光放得更遠---距離市區60公里遠的城市: Taytay(B點)。

謝天謝地, 一路上的路都算好騎,一路上滿滿的鄉村風光。


這天依舊是跳島行程,但大腿在前些行程被礁岩劃傷,要不要下水成了難題。當地人跟我說海水對傷口有幫助,Google說傷口泡海水會有截肢風險,最後...我選擇後者。

Day 5

今天行程跟昨天差不多,以下我就重點介紹啦~

同行友人一早4點半就出發去爬 Taraw cliff了,我有傷在身,只好繼續睡,但從他帶回來的照片來看,我損失慘重....

照片中為同行的一對情侶,不是友人。

整個港口的景色盡收眼底阿阿阿阿阿阿.....痛哭流涕.....

跳島行程:


今天終於出海了。

Day 4

每艘船至少都有三名船員(一個船長,一個導遊,至少一個機動),通常最多話的就是導遊了,另外兩位這次旅行我遇到的都酷酷的,不太講話。

感覺是習慣海上生活了,船長跟機動都不穿救生衣的,其中機動在開船不久後就拿救生衣當床墊,跑到船尾睡覺了....。


今天預定的行程Tour A被取消了。正確來說,所有在海上的Tour都取消了,原因是浪太大。

潘彥銘

On my way to data scientist | Nature lover

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store