{ "cells": [ { "cell_type": "markdown", "id": "fbccc30a-d68e-4814-b0f8-4ac8ab8073b8", "metadata": {}, "source": [ "## Clusterization of time series (Python version)\n", "\n", "This notebook provides some examples of how the functions in the `clustering.py` module can be used. " ] }, { "cell_type": "code", "execution_count": 1, "id": "40710253", "metadata": {}, "outputs": [], "source": [ "import pandas as pd \n", "from epigraphhub.analysis.clustering import *" ] }, { "cell_type": "markdown", "id": "4e6f988d", "metadata": {}, "source": [ "In this tutorial we will use the data saved in the path: `./data/data_to_get_clusters.csv`. This table represets the number of cases reported in Switzerland by canton." ] }, { "cell_type": "code", "execution_count": 2, "id": "6b4aa450", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | georegion | \n", "entries | \n", "
---|---|---|
datum | \n", "\n", " | \n", " |
2021-11-25 | \n", "NW | \n", "72 | \n", "
2021-11-26 | \n", "NW | \n", "73 | \n", "
2021-11-27 | \n", "NW | \n", "42 | \n", "
2021-11-28 | \n", "NW | \n", "46 | \n", "
2021-12-15 | \n", "NW | \n", "47 | \n", "
georegion | \n", "AG | \n", "AI | \n", "AR | \n", "BE | \n", "BL | \n", "BS | \n", "CH | \n", "CHFL | \n", "FL | \n", "FR | \n", "... | \n", "SH | \n", "SO | \n", "SZ | \n", "TG | \n", "TI | \n", "UR | \n", "VD | \n", "VS | \n", "ZG | \n", "ZH | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
datum | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
2020-02-24 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
2020-02-25 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "
2020-02-26 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "1 | \n", "10 | \n", "10 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "1 | \n", "
2020-02-27 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "10 | \n", "10 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "3 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
2020-02-28 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "2 | \n", "10 | \n", "10 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
2022-08-05 | \n", "245 | \n", "1 | \n", "14 | \n", "438 | \n", "124 | \n", "82 | \n", "2975 | \n", "2991 | \n", "16 | \n", "112 | \n", "... | \n", "36 | \n", "109 | \n", "37 | \n", "73 | \n", "148 | \n", "5 | \n", "243 | \n", "108 | \n", "46 | \n", "592 | \n", "
2022-08-06 | \n", "188 | \n", "2 | \n", "9 | \n", "259 | \n", "90 | \n", "65 | \n", "2027 | \n", "2033 | \n", "6 | \n", "76 | \n", "... | \n", "17 | \n", "70 | \n", "18 | \n", "47 | \n", "105 | \n", "0 | \n", "150 | \n", "68 | \n", "19 | \n", "429 | \n", "
2022-08-07 | \n", "101 | \n", "0 | \n", "0 | \n", "175 | \n", "74 | \n", "45 | \n", "1344 | \n", "1345 | \n", "1 | \n", "43 | \n", "... | \n", "13 | \n", "66 | \n", "10 | \n", "29 | \n", "36 | \n", "5 | \n", "113 | \n", "35 | \n", "2 | \n", "368 | \n", "
2022-08-08 | \n", "275 | \n", "4 | \n", "11 | \n", "299 | \n", "168 | \n", "115 | \n", "2795 | \n", "2828 | \n", "33 | \n", "108 | \n", "... | \n", "37 | \n", "138 | \n", "34 | \n", "76 | \n", "119 | \n", "1 | \n", "246 | \n", "119 | \n", "47 | \n", "466 | \n", "
2022-08-09 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "11 | \n", "11 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "2 | \n", "1 | \n", "0 | \n", "3 | \n", "
898 rows × 29 columns
\n", "