Mapování kriminality po česku: Máme za sebou zlomový rok?
Dnes je tomu přesně rok, kdy jsme spustili první verzi internetové mapy kriminality. Za tu dobu se odehrála i spousta jiných dobrých věcí a v oblasti policejních dat se trochu “hnuly ledy”. Hned z několika směrů se v posledním roce podařilo prošlapat cestu k tomu, aby policejní informace sloužily více lidem - policistům i “civilistům”. Ale popořádku.
Policejní data pro veřejnost
O tom, že policie má spoustu zajímavých dat a ta data jsou zajímavá nejen pro ni, ale i pro veřejnost, se hovoří řadu let. S internetovou mapou trestné činnosti jsme tak před rokem vstupovali do pole poměrně prodebatovaného, současně ale docela neznámého. Prostě jsme tehdy vzali statistiky, které policie publikuje na svém webu, a pokusili se z nich umíchat co nejzajímavější sestavu (viz http://puvodni.mapakriminality.cz). Přijetí bylo vřelé, a tak jsme díky vstřícnému postoji ministerstva vnitra a policie dostali příležitost projekt posunout a veřejnosti zpřístupnit mnohem detailnější informace - výsledkem se můžete kochat už od minulého týdne na www.mapakriminality.cz.
Souběžně se vznikáním našeho webu se ale děly věci i v klasických médiích - tedy v médiu, a to iHNed.cz. Jeho datová sekce se kriminalitě začala velmi věnovat a v průběhu roku publikovala sérii článků (jejich autorem je Jan Cibulka), které mapovaly trestnou činnost v Praze, Brně a Ostravě a vyústily ve velmi zajímavý experiment, kdy míra výskytu trestné činnosti v Praze byla dána do souvislosti s počtem přihlášení mobilních telefonů k jednotlivým vysílačům. Výborný nápad, který by mohl inspirovat i policii - a třeba jí pomoci s rozprostíráním jejích sil. V jiném článku se pak autor pokusil zanést všechny případy graffiti v Břeclavi na mapu a zkoumal jejich prostorové rozložení ve vztahu k ostatním prostorovým vazbám ve městě.
Datové vření se nevyhýbá ani policii
Tím se dostáváme k tomu, že data jsou zajímavá nejen pro veřejnost, ale samozřejmě i pro policii a pro posílení její schopnosti bojovat s trestnou činností. A je skvělé, že v roce “mapy kriminality” se podobnou myšlenkou nezabývalo jenom pár novinářů či nadšenců. Policie i ministerstvo vnitra totiž přišli s řadou nápadů, které míří podobným směrem. Začněme u policie.
Je tomu necelý rok, kdy jsme pro jedno policejní oddělení vytvořili on-line mapu výskytu všech trestných činů za zhruba půlroční období. Její vytvoření stálo obrovské množství času - nejdříve musela policie z jednotlivých záznamů vylovit anonymizované údaje s co nejpřesnějším místem určení (někdy to byla adresa, jindy roh dvou ulic, ale našly se i specifikace jako “naproti drogerii” nebo “u řeky”). K těmto údajům jsme pak přiřazovali GPS souřadnice, abychom mohli jednotlivé činy zanést do mapy. Policisté si výsledek pochvalovali - uvědomili si díky tomu některé prostorové vazby, které jim do té doby unikaly.
K našemu potěšení - a nutno zdůraznit, že nikoliv naší zásluhou - byl o pár měsíců později policejní systém zaznamenávání trestných činů upraven tak, že je možné do něj zanášet GPS souřadnice. V praxi to znamená, že se tím otevírají docela nové možnosti analýzy výskytu trestných činů (a je dobře, že význam podobné analýzy je opakovaně zdůrazňován - třeba v dokumentu Strategie prevence kriminality v ČR na léta 2012-2015).
Zhruba ve stejné době začalo ministerstvo vnitra vysílat občasné detekční balónky v podobě mediálních zpráv o tom, že Česko bude mít nové mapové systémy, které umožní policistům detailně analyzovat výskyt trestné činnosti. A nejen to - kromě toho, že data by měla (mohla) být publikována v agregované podobě pro veřejnost, měla by umožnit i to, s čím se (zejména v USA) v posledních letech hojně experimentuje: Na základě matematické analýzy predikovat pravděpodobnost budoucího výskytu trestných činů. Pro někoho děsivá představa, pro datové nadšence příslib vzrušující podívané. Nejsympatičtější na tom celém ale je to, že se ministerstvo vnitra drží při zemi a v současné době připravuje prováděcí studii, na základě které se údajně teprve rozhodne, zda se do tohoto nesmírně ambiciozního projektu vůbec pustí.
Úskalí je celá řada
Ministerstvu vnitra tak možná přišla vhod debata, kterou jsme pořádali na konci října a na níž byly mezi jiným prezentovány i záměry MV. Zřejmě právě proto v debatě samotné jako hlavní téma vyplynula otázka kvality dat a v souvislosti s ní možnost predikce na základě těchto dat.
Vedle obecně uznávaných výtek vůči policejním datům - že zachycují pouze zjištěnou trestnou činnost a nic neříkají o té, jíž policistům nikdo neohlásí, respektive, že data vznikají na základě strategických priorit policie a rozhodování policistů o tom, kam zaměří svou pozornost - se vyskytly i některé zajímavé a nepříliš často slyšené argumenty. Ne přímo proti plánům ministerstva vnitra, ale spíš argumenty varovné.
Martin Nečaský, odborný asistent na Matematicko-fyzikální fakultě UK, který se zabývá zpřístupňováním dat státní správy, upozornil na to, že pro podobnou aplikaci je zcela zásadní, aby sbíraná data odpovídala jejím potřebám. Jinými slovy, je třeba se nejdříve zamýšlet nad tím, k čemu mají být data určena, a teprve poté rozhodovat o tom, v jaké podobě je sbírat a jak je následně třídit. To samozřejmě neplatí pouze pro policejní data, ale pro jakékoliv datové otevírání veřejné správy.
Ladislav Toušek, antropolog ze Západočeské univerzity, který se zabýval kriminalitou v řadě svých výzkumů, upozorňoval na dva sporné momenty podobných přístupů. V obecné rovině predikčním modelům vytýkal to, že pracují pouze se symptomy (protože jednotlivé kriminální činy jsou vždy odrazem nějaké sociální reality, která se zpravidla nevylepší tím, že se podaří dopadnout pachatele). Pro českou praxi je navíc považoval za takřka nepoužitelné, protože ve Spojených státech podle něj fungují především díky tomu, že tamní města mají velké celky s jasně definovanou sociální skladbou obyvatelstva. Česká města jsou oproti americkým výrazně víc sociálně “promíchaná”, a tak je na místě obava, zda bude vůbec nějaká predikce v tak proměnlivém prostředí možná.
Nedá se říct, že by debata celkově vyzněla vyloženě v neprospěch snahy o predikci trestné činnosti. Přinejmenším ale velmi důrazně upozornila na řadu úskalí, s nimiž je zapotřebí se předem vypořádat.
Co čekat v příštím roce?
Policejní data a jejich rozvoj dostaly letos v porovnání s minulostí nebývalé množství impulsů, a tak je na místě velké očekávání. Jestli letošní rok byl v oblasti otevírání a zpřístupňování policejních dat “rokem nula”, ve kterém se otevřela řada dosud nevyužitých příležitostí, ten příští by měl být především o jejich pečlivém zvažování, o učení se, co s nimi a o zkvalitňování policejních dat. Možná se dočkáme prvních pokusů o policejní predikci trestné činnosti na základě modelování dat, určitě si přečteme další zajímavé články na datablogu iHNed.cz a třeba i jinde. S trochou naděje doufáme, že se objeví i nějaká nečekaná analytická využití dat z webu Mapakriminality.cz. Zkrátka, je na co se těšit. Těšte se!
PS: Pro ty, kdo mají z vývoje na scéně policejních dat radost, máme hned dvě dobré zprávy. Mohou nominovat články z datablogu iHNed.cz na Novinářskou cenu. A mohou - ale nejpozději dnes - podpořit web Mapakriminality.cz hlasováním v soutěži OSI Data Visualisation Competition.
Policejní data pro veřejnost
O tom, že policie má spoustu zajímavých dat a ta data jsou zajímavá nejen pro ni, ale i pro veřejnost, se hovoří řadu let. S internetovou mapou trestné činnosti jsme tak před rokem vstupovali do pole poměrně prodebatovaného, současně ale docela neznámého. Prostě jsme tehdy vzali statistiky, které policie publikuje na svém webu, a pokusili se z nich umíchat co nejzajímavější sestavu (viz http://puvodni.mapakriminality.cz). Přijetí bylo vřelé, a tak jsme díky vstřícnému postoji ministerstva vnitra a policie dostali příležitost projekt posunout a veřejnosti zpřístupnit mnohem detailnější informace - výsledkem se můžete kochat už od minulého týdne na www.mapakriminality.cz.
Souběžně se vznikáním našeho webu se ale děly věci i v klasických médiích - tedy v médiu, a to iHNed.cz. Jeho datová sekce se kriminalitě začala velmi věnovat a v průběhu roku publikovala sérii článků (jejich autorem je Jan Cibulka), které mapovaly trestnou činnost v Praze, Brně a Ostravě a vyústily ve velmi zajímavý experiment, kdy míra výskytu trestné činnosti v Praze byla dána do souvislosti s počtem přihlášení mobilních telefonů k jednotlivým vysílačům. Výborný nápad, který by mohl inspirovat i policii - a třeba jí pomoci s rozprostíráním jejích sil. V jiném článku se pak autor pokusil zanést všechny případy graffiti v Břeclavi na mapu a zkoumal jejich prostorové rozložení ve vztahu k ostatním prostorovým vazbám ve městě.
Datové vření se nevyhýbá ani policii
Tím se dostáváme k tomu, že data jsou zajímavá nejen pro veřejnost, ale samozřejmě i pro policii a pro posílení její schopnosti bojovat s trestnou činností. A je skvělé, že v roce “mapy kriminality” se podobnou myšlenkou nezabývalo jenom pár novinářů či nadšenců. Policie i ministerstvo vnitra totiž přišli s řadou nápadů, které míří podobným směrem. Začněme u policie.
Je tomu necelý rok, kdy jsme pro jedno policejní oddělení vytvořili on-line mapu výskytu všech trestných činů za zhruba půlroční období. Její vytvoření stálo obrovské množství času - nejdříve musela policie z jednotlivých záznamů vylovit anonymizované údaje s co nejpřesnějším místem určení (někdy to byla adresa, jindy roh dvou ulic, ale našly se i specifikace jako “naproti drogerii” nebo “u řeky”). K těmto údajům jsme pak přiřazovali GPS souřadnice, abychom mohli jednotlivé činy zanést do mapy. Policisté si výsledek pochvalovali - uvědomili si díky tomu některé prostorové vazby, které jim do té doby unikaly.
K našemu potěšení - a nutno zdůraznit, že nikoliv naší zásluhou - byl o pár měsíců později policejní systém zaznamenávání trestných činů upraven tak, že je možné do něj zanášet GPS souřadnice. V praxi to znamená, že se tím otevírají docela nové možnosti analýzy výskytu trestných činů (a je dobře, že význam podobné analýzy je opakovaně zdůrazňován - třeba v dokumentu Strategie prevence kriminality v ČR na léta 2012-2015).
Zhruba ve stejné době začalo ministerstvo vnitra vysílat občasné detekční balónky v podobě mediálních zpráv o tom, že Česko bude mít nové mapové systémy, které umožní policistům detailně analyzovat výskyt trestné činnosti. A nejen to - kromě toho, že data by měla (mohla) být publikována v agregované podobě pro veřejnost, měla by umožnit i to, s čím se (zejména v USA) v posledních letech hojně experimentuje: Na základě matematické analýzy predikovat pravděpodobnost budoucího výskytu trestných činů. Pro někoho děsivá představa, pro datové nadšence příslib vzrušující podívané. Nejsympatičtější na tom celém ale je to, že se ministerstvo vnitra drží při zemi a v současné době připravuje prováděcí studii, na základě které se údajně teprve rozhodne, zda se do tohoto nesmírně ambiciozního projektu vůbec pustí.
Úskalí je celá řada
Ministerstvu vnitra tak možná přišla vhod debata, kterou jsme pořádali na konci října a na níž byly mezi jiným prezentovány i záměry MV. Zřejmě právě proto v debatě samotné jako hlavní téma vyplynula otázka kvality dat a v souvislosti s ní možnost predikce na základě těchto dat.
Vedle obecně uznávaných výtek vůči policejním datům - že zachycují pouze zjištěnou trestnou činnost a nic neříkají o té, jíž policistům nikdo neohlásí, respektive, že data vznikají na základě strategických priorit policie a rozhodování policistů o tom, kam zaměří svou pozornost - se vyskytly i některé zajímavé a nepříliš často slyšené argumenty. Ne přímo proti plánům ministerstva vnitra, ale spíš argumenty varovné.
Martin Nečaský, odborný asistent na Matematicko-fyzikální fakultě UK, který se zabývá zpřístupňováním dat státní správy, upozornil na to, že pro podobnou aplikaci je zcela zásadní, aby sbíraná data odpovídala jejím potřebám. Jinými slovy, je třeba se nejdříve zamýšlet nad tím, k čemu mají být data určena, a teprve poté rozhodovat o tom, v jaké podobě je sbírat a jak je následně třídit. To samozřejmě neplatí pouze pro policejní data, ale pro jakékoliv datové otevírání veřejné správy.
Ladislav Toušek, antropolog ze Západočeské univerzity, který se zabýval kriminalitou v řadě svých výzkumů, upozorňoval na dva sporné momenty podobných přístupů. V obecné rovině predikčním modelům vytýkal to, že pracují pouze se symptomy (protože jednotlivé kriminální činy jsou vždy odrazem nějaké sociální reality, která se zpravidla nevylepší tím, že se podaří dopadnout pachatele). Pro českou praxi je navíc považoval za takřka nepoužitelné, protože ve Spojených státech podle něj fungují především díky tomu, že tamní města mají velké celky s jasně definovanou sociální skladbou obyvatelstva. Česká města jsou oproti americkým výrazně víc sociálně “promíchaná”, a tak je na místě obava, zda bude vůbec nějaká predikce v tak proměnlivém prostředí možná.
Nedá se říct, že by debata celkově vyzněla vyloženě v neprospěch snahy o predikci trestné činnosti. Přinejmenším ale velmi důrazně upozornila na řadu úskalí, s nimiž je zapotřebí se předem vypořádat.
Co čekat v příštím roce?
Policejní data a jejich rozvoj dostaly letos v porovnání s minulostí nebývalé množství impulsů, a tak je na místě velké očekávání. Jestli letošní rok byl v oblasti otevírání a zpřístupňování policejních dat “rokem nula”, ve kterém se otevřela řada dosud nevyužitých příležitostí, ten příští by měl být především o jejich pečlivém zvažování, o učení se, co s nimi a o zkvalitňování policejních dat. Možná se dočkáme prvních pokusů o policejní predikci trestné činnosti na základě modelování dat, určitě si přečteme další zajímavé články na datablogu iHNed.cz a třeba i jinde. S trochou naděje doufáme, že se objeví i nějaká nečekaná analytická využití dat z webu Mapakriminality.cz. Zkrátka, je na co se těšit. Těšte se!
PS: Pro ty, kdo mají z vývoje na scéně policejních dat radost, máme hned dvě dobré zprávy. Mohou nominovat články z datablogu iHNed.cz na Novinářskou cenu. A mohou - ale nejpozději dnes - podpořit web Mapakriminality.cz hlasováním v soutěži OSI Data Visualisation Competition.