diff options
| author | esquizo <esquizo+noreply@esquizo.net> | 2026-03-13 10:59:40 -0300 |
|---|---|---|
| committer | esquizo <esquizo+noreply@esquizo.net> | 2026-03-13 10:59:40 -0300 |
| commit | 8bff241df92c4d17e6b83242ca329cb680355f88 (patch) | |
| tree | f87192fbd5926521a08b75ae1eb22c6a738ddb11 /blog | |
| parent | f2c68746978fcab88b56323f631f379e4923a627 (diff) | |
adicionado 'anonimato é só estatística'
Diffstat (limited to 'blog')
| -rw-r--r-- | blog/anonimato-estatistica.md | 146 | ||||
| -rw-r--r-- | blog/index.md | 1 |
2 files changed, 147 insertions, 0 deletions
diff --git a/blog/anonimato-estatistica.md b/blog/anonimato-estatistica.md new file mode 100644 index 0000000..959e682 --- /dev/null +++ b/blog/anonimato-estatistica.md @@ -0,0 +1,146 @@ +# Anonimato é só estatística + +Todo mundo vem caracterizado o anônimato como se fosse uma espécie de magia +que faz você ficar invisível na internet, mas é só uma estatistica e um jogo +de _guess who_. Inclusive tem como medir o quanto você é anônimo usando +algumas ferramentas matemáticas. + +## O que é anonimato de fato? + +Anonimato é o ato de você embaralhar algumas informações de forma que ninguém +consegue fazer um pinpoint de quem é você no meio de um espaço amostral. Então +como que uma VPN te mantém anônimo, por exemplo? Ele não te esconde, ele faz +com que todo mundo conectado a uma VPN passe pela mesma range de IPs de forma +que ninguém (do meio privado) consegue deduzir que pessoa está acessando. + +Existem 2 formas de você atingir esse anonimato: + +1. Se misturando na multidão, como VPNs fazem +2. Usando serviços que ninguém* consegue extrair informação útil pra te deanonimizar + +<span style="font-size: 10px;"> +*: ou pelo menos as pessoas que você quer não saibam quem é você +</span> + +## Medindo o anonimato + +Existe uma ferramenta na parte da estatistica chamada _Teoria da informação_, e +ela vai ser extremamente útil para medirmos o quão anônimo uma pessoa é, +levando em consideração que o atacante tem como obter todas as informações que +a vítima expõe. + +### Bits e informação + +Na teoria da informação, a unidade de informação se chama _bit_. Ele tem +relação com o _bit_ da computação, mas não é a mesma coisa. Um _bit_ representa +uma informação sobre a vítima que corta o espaço amostral pela metade. + +Vamos fazer um exemplo de teste. Imaginemos que existe 10 pessoas num espaço +amostral, 5 de camisa amarela e 5 de camisa azul. A informação que você tem +sobre a sua vítima é que ela usa camisa amarela. Quantos bits equivalem a essa +informação? Visto que a informação reduz o seu espaço amostral de 10 para 5, +isso significa que você tem 1 _bit_ de informação (porque 5 é metade de 10). +Agora imaginemos que desses 5, 3 tem olhos marrons e 2 tem olhos azuis. A +informação que você tem sobre a sua vítima agora é que ela tem olhos azuis. +Quantos bits de informação equivalem a essa informação? Exatamente, _1.3219_ +bits de informação. Sim, a nossa definição de bit permite que tenha numeros +reais ao invés de só inteiros. + +A definição do bit segue a seguinte formula. + +<math xmlns="http://www.w3.org/1998/Math/MathML" display="block" class="tml-display" style="display:block math;"><mrow><mi>I</mi><mo>=</mo><mi>l</mi><mi>o</mi><msub><mi>g</mi><mn>2</mn></msub><mo form="prefix" stretchy="false">(</mo><mfrac><mn>1</mn><mi>p</mi></mfrac><mo form="postfix" stretchy="false">)</mo></mrow></math> + +Onde _I_ é o nosso bit de informação e o _p_ é o denominador pelo qual +dividimos um espaço amostral. Note que você pode simplificar essa equação para + +<math xmlns="http://www.w3.org/1998/Math/MathML" display="block" class="tml-display" style="display:block math;"><mrow><mi>I</mi><mo>=</mo><mo form="prefix" stretchy="false">−</mo><mi>l</mi><mi>o</mi><msub><mi>g</mi><mn>2</mn></msub><mo form="prefix" stretchy="false">(</mo><mi>p</mi><mo form="postfix" stretchy="false">)</mo></mrow></math> + +E isso faz com que o numero do bit seja negativo, o que vai ser útil pra gente +medir o anonimato depois. + +Esse comportamento logaritímico do _bit_ é importante, pois torna calculos de +eventos e informações mais simples. Por exemplo, pra se fazer aquele calculo de +informação que você tem naquele primeiro exemplo se usaria a regra do _E_, em +que as probabilidades e as informações se multiplicam, o que torna os calculos +chatos de se fazer. Mas quando você usa logarítimos, essas multiplicações se +tornam adições, o que significa que naquele exemplo, nos temos 2.3219 bits de +informação, o que falta apenas 1 bit pra saber quem é a vítima. Como que eu sei +disso? + +### Entropia + +A entropia é também medida em _bits_. Normalmente esse é o ponto que começam a +se confundir mas é bastante simples. A _entropia_ é a quantidade de bits +necessaria para se reduzir o espaço amostral de busca pra _1_. Por exemplo, se +você tem 8 pessoas num espaço amostral de busca, isso significa que são +necessários 3 bits de informação para se reduzir as suas buscas pra 1 pessoa +só. Ou seja, **a entropia é o pool de bits necessários você descobrir pra se +descobrir quem é a sua vítima**. + +Então no exemplo anterior, eu disse que existem 10 pessoas no espaço amostral. +Com isso, eu posso tirar que a entropia desse espaço amostral é de _3.3219_ bits +usando a formula: + +<math xmlns="http://www.w3.org/1998/Math/MathML" display="block" class="tml-display" style="display:block math;"><mrow><mi>E</mi><mo>=</mo><mi>l</mi><mi>o</mi><msub><mi>g</mi><mn>2</mn></msub><mo form="prefix" stretchy="false">(</mo><mi>s</mi><mo form="postfix" stretchy="false">)</mo></mrow></math> + +Onde _E_ é entropia e _s_ é o tamanho do espaço amostral. No caso do exemplo anterior _s_ = 10. + +### Juntando tudo + +Com isso, podemos fazer uma espécie de joguinho, onde a entropia é o _HP_ do +seu anonimato e a informação são os danos que você tomou. Mais especificamente + +<math xmlns="http://www.w3.org/1998/Math/MathML" display="block" class="tml-display" style="display:block math;"> + <mrow> + <mi>HP</mi> + <mo>=</mo> + <mi>E</mi> + <mo>+</mo> + <mrow> + <munder> + <mo movablelimits="false">∑</mo> + <mi>n</mi> + </munder> + </mrow> + <msub> + <mi>I</mi> + <mi>n</mi> + </msub> + </mrow> +</math> + +Note que estamos aproveitando o fato da informação ser um numero negativo aqui. + +A nossa entropia sempre começa com log2 do numero de pessoas da terra, +então ~33.04 bits de entropia, atualmente. Existem algumas informações que +você toma de graça. + +* Sexo = 1 bit +* Nascer no Brasil = 5 bits +* Ter internet = 5 bits + +E assim vai. Ou seja, logo de cara você já deve tomar 11 bits de informação, o +que sobra 22 bits de entropia de informação. Não tenha medo, pois 22 bits ainda +significa que você é 1 entre 4.194.304 de pessoas, não é algo fácil de se fazer +busca. Note que existem informações que você pode espalhar e nem sabe que isso +pode te deanonimizar, são mais uns bitzinhos que você vai tomar na sua pool de +entropia, e existem vários pontos meio escondidos, por exemplo o fingerprint do +navegador. E lembre-se que isso é levando em consideração que _toda_ informação +que você soltar é aproveitável pelo atacante, existem algumas informações que +não são aproveitáveis. Por exemplo, se você sabe que o seu atacante é uma +pessoa física normal, sem contatos estranhos com o governo, você sabe que pode +confiar que algumas informações serão mais difíceis do atacante obter. + +E outra coisa é que informações podem remover a importância de outras +informações. Um exemplo bobo seria você ser católico e morar no Vaticano, a +probabilidade de você já ser um católico no Vaticano já é alta. + +## Conclusão + +Anonimato é estatística, é só matemática. Existe uma forma de medirmos o quanto +de informações estamos expondo, assim como medir o quão difícil é pra obter +essas informações. Isso pode ser usado pra várias coisas, pra facilitar buscas +de criminosos pela polícia, ajudar a saber se esconder melhor de mal-feitores +e até abre uma possibilidade de fazermos melhores legislações sobre o quanto +de informação as empresas podem obter dos seus usuários. + diff --git a/blog/index.md b/blog/index.md index 6388304..ab98f7a 100644 --- a/blog/index.md +++ b/blog/index.md @@ -1,5 +1,6 @@ Lista de blogs +- [Anonimato é só estatistica](anonimato-estatistica.html) (sex 13 mar 2026 10:58:31 -03) - [First!](first.html) (sex 13 mar 2026 00:36:42 -03) - [Voltar](/) |
