Schema #40. Šiek tiek statistikos apie 2016 kandidatus į Seimą

Per Laisvės TV, kur mes ir jie laikomės ten, Andrius Tapinas panagrinėjo kandidatų mokesčių ir pajamų statistiką:

 

Tai man pasirodė visai įdomu ir aš pagalvojau, kad galiu irgi paanalizuoti tuos duomenis kažkaip. Viena tik bėda – duomenis gauti gan keblu. VRK.lt viskas yra, bet duomenys sumėtyti į subpage’us visokius. Jeigu reiktų rankiniu būdu rinktis duomenis, tai užsi…tum. Ėmiau ieškoti kokių nors įrankių, kurių pagalba tą procesą galėčiau automatizuoti. Kažką radęs papostinau į Feisbook’ą džiaugsmingą “ParseHub” atradimą.

Su sąlyga, kad turiu puikių friendų ir followerių, tai ten gan greitai, žmonės viską ėmė ir padarė ir sudėjo į github’ą (čia tie friendai ir followeriai, kurie labiau draugauja su programavimo kalbomis ir visokių duomenų scrapinimu iš web’ų).

Mano friendai ir followeriai yra nerealūs! 🙂

Negana to, tuose pačiuose komentaruose ėmė ir sudėjo nemažai įdomios statistikos naudojant MS Power BI.

Man nelabai beliko ko daryt daugiau. Nebent sugalvočiau kokias įdomesnes koreliacijas. Kol kas nieko įdomesnio nesugalvojau, kaip kandidatų amžiaus histogramą ir šiek tiek informacijos apie nuteistus kandidatus.

Apie amžių:

Kandidatų amžiaus histograma. Matome, kad daugiausiai 50mečių - 60mečių.
Kandidatų amžiaus histograma. Matome, kad daugiausiai 50mečių – 60mečių.

Manau, kad gan normalu turėti būtent tokį amžiaus pasiskirstymą, nors norėtųsi daugiau jaunų gal. Kaip manot?

Seniausias: Pranas Kavaliauskas, 88 metai
Jauniausias: Dobilas Sinkevičius, 25 metai. Yra ir daugiau 25’mečių, bet ponas Lauras gimęs vėliausiai 1991 metais. Už jį viena diena senesnis yra ponas Modestas Barauskas – save išsikėlęs.

Vyriausiasis kandidatas pas Krivicką-Puteikį – jie gi ir pensininkų partijos nuotrupas kažkokias turi. O jauniausias pas TT.

O čia visų partijų kandidatų amžių histogramos:

Visų partijų sąrašų amžiaus histogramos
Visų partijų sąrašų amžiaus histogramos

Pamėginau paskubomis sudėti histogramas pagal panašumą.

Viršutinė eilutė sąrašų turi daugiau vyresnių kandidatų nei jaunesnių (apatinė irgi lyg ir). LSDP laiptai stačiausi (nuo jaunų į vyresnius žiūrint), tai reiškia, kad pas jų didesnė vyresnių kandidatų koncentracija.

LRLS, tuo tarpu, amžiaus pasiskirstymas tolygiausias ir man tai atrodo kaip geras dalykas 🙂

Daugiausiai jaunų turi Žalieji (bet ne valstiečiai).

Teistumai.

Nupaišiau Pareto diagramą. Tai tokia diagrama, kur stulpeliai – duomenys, jie būna mažėjimo tvarka iš kairės į dešinę, o virš jų esanti linija yra procentų suma, kuri didėja iš kairės į dešinę. Ta procentų suma parodo kur yra didžiausia duomenų koncentracija:

Pareto grafikas pagal kurį aiškiai matosi kur didžiausia koncentracija teistųjų.
Pareto grafikas pagal kurį aiškiai matosi kur didžiausia koncentracija teistųjų.

Taigi, lyderiai yra Drąsąkeliai, TT ir Pelėsių TV (Liaudies) partijos, kuriose yra 50 procentų visų nuteistų kandidatų.

LRLS yra du kandidatai abu nuteisti už klaidingą apskaitą.

Update:

Sudėjau visų kandidatų ir sąrašo top 40 amžiaus palyginimą:

Amžiaus histogramos viso ir top 40 sąrašų palyginimui.
Amžiaus histogramos viso ir top 40 sąrašų palyginimui.

LRLS jaunuosius savo kandidatus stumtelėjęs į sąrašo pabaigą, bet ir vyresniųjų nukando. Apie savo partijos reitingavimus ir to rezultatus jau rašiau.

TSLKD antai vyresnieji (55-60 metai) monolitiškai pirmose vietose. Gražu, kad 30-35 kilstelėję į priekį.

LSDP monolitai dar senesni: 60-65. O ir senolius gerai vertina (nuo 70). 25-30 ir 35-40 ruožą išvis išmetę.

Sąrašistai nepasikeitę, nes jų tik ~40 apskritai 😀

TT irgi savo tvirtąją nomenklatūrą siūlo rinkėjams.

DP – lygiai kaip ir TT.

Valstiečių-Žaliųjų ir Žaliųjų irgi mažai, tai niekas ten nesikeičia.

Zuokininkai praspyrę senolius ir jaunuolius 🙂

Tomaševskininkai 40-45 diskriminuoja.

Tautininkų, kaip ir PuteiKrivickininkų, Pelėsių TV (liaudies partija), drąsąkelių – tiesiog mažai.

Na, o be sąrašo eina tiesiog be sąrašo. Įdomiau gal tik tai, kad gan tiksliai atkartoja visų kandidatų histogramos formą.

Tai tiek šiandien Schemos. Daugiau:

Schema #39
Schema #38
Schema #37
Schema #36
Schema #35

Skirmantas Tumelis

Sudėtingi dalykai susideda iš paprastų. O patys sunkiausi yra paprasti dalykai.

What do you think?

Note: Your email address will not be published

You may use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <div align="" class="" dir="" id="" lang="" style="" xml:lang=""> <embed style="" type="" id="" height="" width="" src="" object=""> <iframe width="" height="" frameborder="" scrolling="" marginheight="" marginwidth="" src=""> <img alt="" align="" border="" class="" height="" hspace="" longdesc="" vspace="" src="" style="" width="" title="" usemap=""> <map name="" area="" id=""> <object style="" height="" width="" param="" embed=""> <param name="" value=""> <pre style="" name="" class="" lang="" width="">

Popo.lt tinklaraščiai. Hosting powered by   serverių hostingas - Hostex
Skip to toolbar