Conteúdo Científico – Daemon

White Paper: Aircraft Development and Quant Portfolio Management

Daemon Investments — Tue, 17 Jan 2023 14:21:52 +0000

Por Gabriel Koike

Neste artigo, Gabriel Koike, do nosso time de estratégias sistemáticas usa seus conhecimentos de formação – formado em Engenharia Eletrônica pelo Instituto Tecnológico de Aeronáutica (ITA) – para criar um paralelo entre aviação e fundos quantitativos sistemáticos.

*Texto em inglês

DOC-AircraftDevelopmentandQuantPortfolioManagement-061222-2125-final Baixar

Palavra do Ano: Correlação

Daemon Investments — Thu, 29 Dec 2022 13:57:23 +0000

Por Hully Rolemberg

Nada como as festas de fim ano para inspirar uma nova temporada de artigos por aqui. 2022 foi mais um ano com acontecimentos que impactaram os mercados ao redor do mundo todo. Desde as falas de Jerome Powel até as eleições no Brasil, passando pela aquisição do Twitter pelo bilionário Elon Musk e o colapso da bolsa de cryptocurrency FTX… Um ano para não esquecer. Todos esses eventos marcaram os mercados financeiros globais e certamente deixaram rastros nas carteiras de muitos investidores, especialmente aqueles que não fizeram um uso eficiente da diversificação em suas carteiras. Dito isso, a palavra do ano (escolhida por mim) só pode ser uma: correlação.

O que é correlação?

A definição de cor·re·la·ção pode ser simples: relação entre duas coisas. O prefixo “co” é um elemento de companhia, simultaneidade, ao passo que “relação” representa vínculo, ligação. Na matemática, correlação tem uma definição um pouco mais sofisticada introduzida por Karl Pearson no final do século XIX: grau de dependência linear entre duas variáveis. Foi a partir da definição formal do coeficiente de correlação que Pearson iniciou o que seria a revolução estatística no estudo da matemática.

Karl Pearson foi o primeiro a reconhecer o valor dos modelos estatísticos como alternativa à visão determinística que prevalecia na ciência do século XIX. Todavia, a ideia por trás do conceito de correlação surgiu um pouco antes, dentro da biologia. Francis Galton, mais conhecido pelo “descobrimento” das digitais, observou na população da época um fenômeno de regressão à média da altura dos indivíduos de geração para geração: filhos de pais muito altos tendem a ser mais baixos que seus pais e filhos de pais muito baixos tendem a ser mais altos que seus pais. Por isso, a média de altura da população era razoavelmente estável longo do tempo.

O gráfico abaixo mostra a altura média dos pais no eixo vertical e a altura média dos filhos no eixo horizontal. Os dados são os mesmos analisados por Galton na época em que ele identificou o efeito de regressão à média. A reta destacada representa a relação linear entre os pontos^[1] e sua inclinação é exatamente o coeficiente de correlação (!!!).

O fato é que o fenômeno de regressão à média se aplica a muitas outras observações científicas além da altura dos indivíduos. É ele que garante estabilidade evolutiva, mantendo as espécies razoavelmente “iguais” de geração para geração, por exemplo. Galton descobriu a métrica matemática para medir essa relação e denominou essa definição de “coeficiente de correlação”. Era uma fórmula bastante específica para descrever um único aspecto da regressão à média, mas que não dizia nada sobre a causa do fenômeno.

A palavra eventualmente virou parte do vocabulário popular e passou a ser usada de forma coloquial para descrever a relação entre duas coisas. Galton chegou muito perto de revolucionar toda a ciência da época, mas foi seu discípulo Karl Person que formalizou a ideia de maneira mais completa e deu início a revolução estatística (que é assunto para um outro texto). A definição da correlação de Pearson pode ser descrita pela fórmula abaixo:

Onde i é um indexador e pertence ao conjunto de números naturais, x_i é o valor da variável x para um elemento i da amostra, x-barra é a média amostral de x, y_i é o valor da variável y para um elemento i da amostra, e y-barra é a média amostral de y.

De maneira simplificada, o coeficiente de correlação é dado pela covariância dividida pelo produto dos desvios-padrão e, por definição, seus valores estão restritos ao intervalo fechado entre -1 e 1. Quanto mais próximo dos extremos for o valor da correlação, mais correlacionadas são as séries x e y. Quando o coeficiente é próximo de zero, dizemos que as variáveis são pouco correlacionadas.

Por que correlação é importante na hora de construir uma carteira de ativos?

Apesar de eu nunca querer te entediar com fórmulas matemática, não podemos fugir do fato de que a utilidade da correlação em finanças é completamente baseada na matemática. Pense em uma carteira P composta por dois ativos, A e B. A variância dessa carteira é dada por:

Observe a covariância pode ser definida em termos de correlação e variância (e de fato essa parece ter sido a ordem cronológica das coisas):

É fácil ver que (1) se a correlação é -1, a variância da carteira é mínima; (2) se a correlação é 1, a variância da carteira é máxima; e (3) se a correlação é zero, a variância da carteira é igual a soma das variâncias ponderada pelos pesos quadráticos. Em outras palavras, o risco da carteira diminui quando adicionamos ativos com correlação negativa, esse é um dos princípios básicos da diversificação em finanças.

Ativos com correlação próxima de 1 estão expostos a riscos similares: se um subir o outro provavelmente também vai subir. Ao adicionar ativos com correlação elevada na carteira, estamos aumentando a exposição a esses fatores de risco semelhantes e tornando o portfólio mais vulnerável. Por outro lado, ativos com correlação próxima de -1 funcionam como proteção natural: quando um cai o outro sobe. Se conseguirmos fazer uma alocação inteligente dos ativos, podemos nos beneficiar da diminuição do risco e, na média, ganhar mais do que perder. Ativos com correlação próxima de zero são neutros, isto é, nem adicionam e nem diminuem o risco da carteira.

Por que correlação é importante na indústria de fundos?

Do ponto de vista do investidor, fundos nada mais são do que ativos e, portanto, uma carteira de fundos também deve seguir os princípios da diversificação e evitar posições com exposição a fatores de risco semelhantes, isto é, correlação próxima de 1. Consequentemente, a correlação entre os fundos acaba sendo muito importante também para os gestores: assumindo que os investidores preferem diversificar, os fundos vão preferir não ser positivamente correlacionados com seus pares. Diferenciação é chave nessa indústria.

Fundos com correlação próxima de 1 estão expostos aos mesmos fatores de risco, ou seja, exploram oportunidades de lucro semelhantes. Pense nos fundos “macro”: a maioria deles se baseia nas mesmas variáveis macroeconômicas – inflação, PIB e desemprego. Por isso, qualquer grande movimento em uma dessas três variáveis afetará esse grupo de fundos de forma bem parecida. O gráfico abaixo mostra a performance dos principais fundos “macro” no primeiro trimestre de 2022. No geral, o padrão observado é bem parecido.

O mesmo efeito acontece em fundos da ações long only, por exemplo. Nesse caso, o fator de risco é obviamente a bolsa e, por isso, a performance desses fundos acaba sendo semelhante à performance do índice. O gráfico abaixo mostra a correlação de dois fundos com alguns índices de mercado. O fundo I é claramente mais correlacionado com os benchmarks do que o fundo II, em particular Ibovespa. O fundo II, por sua vez, tem correlação praticamente zero com o Ibovespa.

De fato, se nós compararmos a performance desses fundos ao longo do tempo com a performance do Ibovespa, o Fundo I foi mais impactado por grandes movimentos de mercado do que o Fundo II. O gráfico abaixo mostra a performance acumulada (não normalizada pela volatilidade) dos fundos versus a performance do índice desde 2016. O choque do COVID-19 no começo de 2020 exemplifica bem o efeito das correlações nesse caso.

Correlação ou não correlação, eis a questão…

2022 foi um ano de altas correlações entre os mercados, as bolsas, os ativos… Nunca foi tão importante se diferenciar, diversificar. Na vida e nos mercados! Afinal, ninguém quer ser mais do mesmo, certo?

Feliz Ano Novo!

[1] chamamos de essa reta de reta de regressão

[2] AGG: Bloomberg US Agg Total Return Value Unhedged USD Index

White Paper: Backtesting is about the past

Daemon Investments — Fri, 01 Jul 2022 16:24:20 +0000

Por Hully Rolemberg e Gabriel Koike

“Backtest” é provavelmente uma das palavras mais usadas no ramo de finanças quantitativas e significa simplesmente “testar uma estratégia de investimentos usando dados históricos”. Em outras palavras, um backtest simula como teria sido a performance de um determinado sistema de trading no passado, se o passado tivesse acontecido exatamente da forma que ele aconteceu. Backtests são comumente utilizados para avaliar a viabilidade de estratégias de investimentos, mas seus resultados devem ser interpretados com cuidado, pois esse tipo de abordagem depende de uma série de hipóteses não triviais que, se forem violadas, podem gerar resultados completamente enganosos.

Dada a sua importância inegável no dia a dia de qualquer fundo sistemático-quantitativo, nosso primeiro white paper* é sobre ele, o backtest. Neste artigo, nós abordamos os principais erros cometidos por pesquisadores e agentes do mercado financeiro ao desenvolverem e implementarem análises de backtest. As ideias apresentadas no texto são particularmente interessantes para investidores que utilizam resultados “backtestados” para avaliar a performance de uma carteira de ativos, por exemplo. É sempre bom ter em mente: backtests não são sobre o futuro, mas sim sobre o passado…

*Texto em inglês

White Paper: Backtesting is about the past Baixar

Leia também o texto “Métodos de Gestão de Investimentos”.

Carta do Gestor Junho 2022

Daemon Investments — Tue, 28 Jun 2022 15:27:35 +0000

Na Carta do Gestor de junho, nosso sócio-fundador, Sérgio Schirato, apresenta uma série de acontecimentos que marcaram o semestre na Daemon como nossos 13 anos de história, o crescimento da nossa operação no Brasil e no Estados Unidos e o lançamento de novos produtos, como por exemplo, nosso primeiro Fundo de Investimento em Participações, o Daemon Hemera, focado em energia renovável, que será aberto aos investidores no próximo semestre.

Além disso, comenta os efeitos da guerra na Ucrânia para a economia mundial e as incertezas que rondam o setor, destacando os resultados do nosso fundo sistemático Daemon Nous Global, que mesmo diante de turbulências, as estratégias de diversificação e descorrelação se mostraram bem eficientes.

Acesse aqui

Previsões são sobre o futuro

Daemon Investments — Tue, 31 May 2022 16:04:27 +0000

Por Hully Rolemberg

Futuro

Conjunto de fatos relacionados a um tempo que há de vir

Destino, sorte, acaso ou como você quiser definir

O futuro é incerto, mas não impossível de inferir

Não é mágica, como parece, e tenho que admitir

É quase tudo sobre autocorrelação, não se deixe iludir

Previsões só são difíceis se forem sobre o futuro que há de vir…

Se você acompanha os meus artigos, já sabe que modelos são aproximações da realidade válidas sob condições específicas e comumente usadas para obter relações contemporâneas (isto é, para um mesmo instante de tempo) entre diferentes variáveis. Por exemplo, Modelos de Fatores são usados para estimar a relação de uma variável em relação a diferentes fatores de risco. Alternativamente, nós podemos usar modelos para aproximar o comportamento de uma variável em relação ao seu próprio passado (e até mesmo em relação ao passado de outras variáveis), obter estimativas do grau de dependência dela e extrapolar o comportamento estimado para o futuro. Neste artigo, vou te apresentar uma forma simplificada de como fazer exatamente isso: prever o futuro.

Obter previsões em si não é uma tarefa muito complexa. Podemos sempre dizer que a previsão para o que vai acontecer amanhã é exatamente o que aconteceu hoje: a inflação do ano que vem será igual à inflação desse ano. Essa seria uma previsão ingênua, afinal é improvável que os preços permaneçam completamente parados de um ano para o outro. Mas não é improvável que a inflação do ano seguinte seja bem próxima da inflação corrente porque existe uma certa inércia nos preços, isto é, os preços tendem a se mover lentamente. Chamamos essa inércia de autocorrelação.

Correlação você provavelmente já sabe que é definida como a relação de dependência entre duas variáveis. Autocorrelação, por sua vez, é definida como a correlação de uma variável com ela mesma. Assim como a correlação, quanto mais próxima de 1 for a autocorrelação, mais dependente é a variável em relação a ela mesma. Note que para um determinado instante de tempo, a autocorrelação entre uma variável e ela mesma tem que ser exatamente 1. Por exemplo, a autocorrelação da inflação desse mês com a inflação desse mês é 1 porque os dois valores são exatamente iguais.

Mas, a graça da autocorrelação não é o caso em que ela é igual 1. A autocorrelação é uma ferramenta matemática que nos permite encontrar padrões de repetição a partir do cálculo do grau de dependência de uma variável com o seu passado. Pense no caso da inflação: se a autocorrelação entre a inflação do mês corrente e a do mês anterior é igual a 0.9, então , de forma simplificada, podemos dizer que o valor realizado da inflação no mês que vem é determinado por 90% da inflação do mês anterior mais um erro aleatório. Essa situação pode ser representada matematicamente da seguinte forma:

Se assumirmos que a equação acima é válida para todo instante de t tempo, ou seja, a autocorrelação entre dois períodos consecutivos é sempre 0.9, então a equação acima pode ser usada para calcular a inflação em qualquer instante de tempo a partir do valor realizado no período anterior. Classificamos esse tipo de modelo como autorregressivo de primeira ordem, pois só considera a relação de dependência da variável com ela mesma defasada um único período. Modelos autorregressivos simples como esse são muito utilizados como ponto de partida para obter previsões de variáveis financeiras e macroeconômicas, por exemplo. Mas, modelos são modelos e só são válidos sob certas hipóteses, nesse caso, sobre o termo de erro ε_t.

Uma pausa na matemática para uma breve reflexão poética. Economistas (como eu) amam modelos. Nós tentamos fazer aproximações da realidade o tempo todo. Sim, modelos são simplificações. Sim, modelos dependem de uma série de hipóteses. Sim, nós sabemos que algumas dessas hipóteses parecem heroicas. E ainda assim continuamos desenvolvendo modelos. Isso porque os mercados não são completamente imprevisíveis. Existem padrões que se repetem ao longo do tempo e mudam lentamente. Nós queremos prever esses padrões para um dado nível de confiança. Acredite em mim ou não, mas funciona. Mais importante do que a previsão em si é conseguir calcular o erro da previsão. É isso que diferencia uma previsão boa e uma previsão ruim. Agora, de volta à matemática.

No exemplo da inflação, para fins ilustrativos, nós assumimos que relação de dependência entre a inflação corrente e a inflação do período anterior é 0.9, não importa o período que estamos avaliando, mas e se quiséssemos estimar esse número para o índice de inflação qualquer? Um modelo autorregressivo, como o próprio nome sugere, é um modelo de regressão cujos parâmetros podem ser estimados assumindo que o erro segue um processo ruído branco¹. Podemos escrever um modelo autorregressivo de primeira ordem genérico para a inflação, também chamado de AR(1), da seguinte forma:

Em que α é um termo constante no tempo e θ é o coeficiente autorregressivo. E se, por outro lado, nós acreditássemos que a inflação é, na verdade, determinada pela inflação do mês anterior e pela inflação do ano anterior? Nesse caso, basta incluir um termo defasado 11 meses para trás no modelo autorregressivo (isso porque nosso período de referência é t+1 e t+1-12=t-11). Veja equação abaixo:

Podemos seguir essa lógica indefinidamente e adicionar quantas defasagens nós acharmos que forem necessárias para descrever a dinâmica de π_t. Usando um software estatístico, nós conseguimos estimar facilmente os parâmetros de um AR(p) qualquer, em que p determina a ordem o processo. Todavia, não quero você pense que isso é mágica, então segue uma explicação breve sobre como são estimados os parâmetros de um modelo autorregressivo.

Existem diferentes formas de estimar os coeficientes de um AR (incluindo o famoso método de Mínimos Quadrados Ordinários), mas a minha favorita é o método de momentos usando as equações de Yule e Walker², pois essa abordagem nos permite encontrar a solução exata do sistema recursivamente. De maneira simplificada, pense no modelo autorregressivo de primeira ordem definido como:

em que γ é o coeficiente autorregressivo e ν é o termo de erro. Multiplique os dois lados do modelo por y_t,

tome o valor esperado dos dois lados,

Como γ é uma constante (ou seja, uma variável determinística), o valor esperado dela é ela mesma e podemos deixar esse termo fora da operador de valor esperado. Observe que, como ν_t é por hipótese um ruído branco, o erro no período t é necessariamente não correlacionado com o passado do processo, representado por y_t. Assim, o último termo da equação é zero e temos a seguinte expressão:

Simplificadamente, podemos assumir que a média do processo y é zero e definir E[y_ty_t+1] como a autocovariância de primeira ordem (c₁) de y e E[y_t²] como a autocovariância de ordem zero (c₀), ou seja, a variância. Renomeando as variáveis temos

Dividindo os dois lados pela variância do processo, isto é c₀, e trocando de lado os temos temos,

Ou seja, o valor de gamma é dado pela autocovariância de primeira ordem dividida pela variância. Essa é exatamente a definição da autocorrelação de primeira ordem. Em outras palavras, o coeficiente do modelo autorregressivo de primeira ordem é dado pela autocorrelação de primeira ordem do processo, mas isso não é nenhuma surpresa porque eu já tinha te dado um spoiler no exemplo da inflação. O fato é que nós conseguimos fazer esse processo recursivamente para autocorrelações de ordens mais alta e assim obter uma solução fechada para os p coeficientes de um AR(p).

Estimar as autocorrelações e, consequentemente, os coeficientes do modelo autorregressivo é o primeiro passo para chegar no nosso objetivo principal: prever o futuro. Supondo que os coeficientes que nós estimamos são estatisticamente significantes, isto é, próximos dos seus valores verdadeiros, nós sempre vamos conseguir saber o provável valor de y em um dado instante de tempo só usando os seus valores passados. Existem uma série de incertezas envolvidas nessa previsão, já que não conhecemos a distribuição verdadeira do processo e, portanto, nunca saberemos o valor verdadeiro dos parâmetros. Mas, ainda assim, conseguimos fazer boas aproximações para variáveis bem comportadas³.

Sendo assim, um AR(1) pode ser usado para prever uma variável “um passo à frente” a partir da seguinte lógica: nós usamos todo o passado disponível até hoje para estimar os parâmetros e inferimos o valor da variável amanhã usando o valor realizado dela hoje. Seguindo essa lógica, um AR(2) convencional pode ser usado para fazer uma previsão “dois passos à frente” usando todo o passado disponível até hoje para estimar os parâmetros, inferindo o valor da variável amanhã e utilizando essa informação para prever o valor da variável depois de amanhã. E assim sucessivamente o quanto quisermos. O céu é o limite.

Todavia, quanto mais distante for o futuro que estamos interessados em prever, mais defasadas serão as relações que nós teremos que estimar e mais previsões intermediárias nós talvez tenhamos que usar como insumos da previsão final. Por isso, previsões muito passos à frente são muito mais ruidosas – elas dependem de um passado super persistente ou sazonalidades bem definidas. Uma das formas de melhorar nossas previsões de modelos autorregressivos é usar o passado de outras séries também (modelos multivariados como VAR, por exemplo). Mas, a verdade é que modelos autorregressivos, apesar de simples, dão conta de boa parte do trabalho de prever o futuro, para um certo nível de erro.

Toda previsão tem um erro de previsão associado a ela, não temos como fugir disso, e nem queremos. Praticamente toda a teoria estatística gira em torno dele: o termo de erro. De fato, a primeira distribuição de probabilidade que se tem registro foi criada em 1820 por Laplace e é denominada justamente “distribuição do erro”. Pierre Simon Laplace foi um matemático francês com contribuições muito importantes para os campos de estatística, matemática, física e astronomia. Laplace descreveu pela primeira vez como computar a posição futura dos planetas baseado em algumas observações da Terra e percebeu que a observação dos planetas e cometas não se encaixava exatamente nas posições previstas em teoria. Para levar esse problema em consideração, ele criou a “função erro”.

Na época, acreditava-se que, conforme a ciência avançasse, as métricas se tornariam mais precisas e os erros diminuíram, mas o que aconteceu foi justamente o contrário: quanto mais precisas eram as ferramentas para medir os fenômenos (matemáticos, físicos, biológicos e astronômicos), mais erros se acumulavam. Gradualmente, a ciência começou a trabalhar com um novo paradigma, o modelo estatístico da realidade. Era o começo da revolução estatística, mas isso é assunto para uma outra conversa.

Medir o erro é crucial. Mas, como medir o erro de previsão? E mais importante que isso, como usar o erro para selecionar a melhor previsão? Como eu disse no verso que iniciou esse texto: previsões só são difíceis se forem sobre o futuro que há de vir. Então, o que nós (pessoas determinadas a prever o futuro) fazemos é não esperar o futuro chegar para avaliar como as nossas previsões vão se sair, mas sim selecionar um período de tempo na história para chamar de passado e outro pra chamar de futuro. É o que os cientistas de dados chamam de amostra de treino e amostra de teste.

A lógica é simples: a amostra de treino é usada para estimar os parâmetros e a amostra de teste para obter as previsões e comparar com o realizado. Podemos fazer isso com amostras fixas ou ir expandindo a janela de treino com o passar do tempo, assim como ocorre na realidade em que à medida que os dias vão passando a história vai crescendo. Existem diferentes métricas para calcular o erro observado entre a previsão e o realizado – Raiz do Erro Quadrático Médio (RMSE), Erro Absoluto Médio (MAE), Erro Percentual Médio Absoluto (MAPE), Erro Quadrático Médio (MSE), entre outras – cada uma com suas vantagens e desvantagens dependendo do contexto da aplicação.

A partir de uma métrica de erro podemos reavaliar os modelos usados para estimação/previsão e escolher aquele que se comporta melhor na amostra de teste. Eu chamo isso de “prever o futuro”. Difícil de acreditar? No meu primeiro artigo sobre volatilidade, eu te mostrei como um portfólio long-only em S&P500 escalado pela volatilidade tem performances distintas dependendo de como nós prevemos a volatilidade e a conclusão é que usando variações de modelos autorregressivos nós obtemos resultados superiores aos de um portfólio que usa a previsão ingênua (volatilidade amanhã é a volatilidade hoje) para escalar os retornos.

Previsões não são perfeitas, tenho que admitir, e “retornos passados não são garantia de performance futura”. Isso porque, mesmo que nós usemos as melhores ferramentas disponíveis e nossas previsões sejam super robustas do ponto de vista estatístico, elas ainda assim são corretas apenas na média e poderão estar erradas algumas vezes ao longo do tempo. Neste artigo, não falamos sobre quebras estruturais não controladas nas séries ou erros nos modelos, por exemplo, dois fatores que podem destruir uma previsão a princípio “correta”. O fato é que incertezas sempre vão existir, mas nós podemos medir o erro e fazê-lo, em média, diminuir. Assim, previsões só serão difíceis se forem sobre o futuro que há de vir.

Notas:

1: Uma série é definida como um ruído branco se possuir média zero, variância finita e suas observações não forem correlacionadas entre si.

2: As equações de Yule e Walker são a base dos modelos autorregressivos lineares, conectando os parâmetros do modelo à função de autocovariância do processo.

3: Chamamos de “bem comportada” uma série de tempo estacionária.

Leia também o texto: “Derivativos são divertidos”.

Derivativos são divertidos

Daemon Investments — Fri, 29 Apr 2022 16:28:44 +0000

Um texto sobre por que derivativos existem.

Por Hully Rolemberg

Um tempo atrás, durante um jantar, eu recebi a seguinte pergunta: “o que são derivativos?”. Fácil. Derivativos são contratos cujo valor está atrelado à performance de um outro ativo, isto é, deriva de outro ativo. A resposta convenceu, mas veio seguida de uma pergunta um pouco mais complexa “por que derivativos existem?”. Derivativos são ativos que podem ser negociados em bolsa ou não para fins de proteção ou especulação, por exemplo. A explicação fez sentido, mas ainda havia uma pergunta final: “não seria mais fácil simplesmente negociar os ativos ao invés de ativos derivados dos ativos?”. Eu queria responder essa pergunta de forma que todas as pessoas interessadas no assunto entendessem, então resolvi escrever esse texto.

Derivativos nada mais são do que contratos de compra e venda sobre um determinado ativo (denominado ativo-objeto), com preços, quantidades e vencimentos pré-estabelecidos. Existem registros de uso de derivativos (inicialmente não com esse nome) desde muito antes da consolidação do mercado financeiro como conhecemos hoje. Os primeiros derivativos eram bem mais simples e tinham uma única função clara: proteção. Eram contratos semelhantes aos contratos futuros que conhecemos hoje, firmados entre agricultores e consumidores a partir da necessidade de se proteger das variações de preços das commodities entre as safras.

Pense na situação de um produtor de arroz que precisa vender o seu produto, e assuma que o ciclo de plantio do arroz dure em média 120 dias. O produtor enxerga o preço de mercado do arroz no início do ciclo e decide a quantidade a ser plantada. O mercado de arroz é perfeitamente competitivo e esse produtor é tomador de preços. Assuma que a função oferta desse produtor seja dada por q(p) = 2p e que a quantidade demandada seja zero fora do preço de equilíbrio. Se o preço de equilíbrio da saca de arroz é $100 em t=0 (início do ciclo), a quantidade ótima a ser produzida nesse caso é de 200 sacas de arroz, obtendo uma receita de $20.000.

Imagine agora que durante esse ciclo de arroz ocorra um choque de demanda que faz com que o novo preço de equilíbrio seja $90 em t=120 (fim do ciclo). A esse novo preço, a quantidade ótima a ser ofertada é, na verdade, 180 sacas de arroz, o que resultaria em uma receita de $16.200. De forma simplificada, e assumindo custo de produção zero, podemos dizer que o produtor teve um “prejuízo” de $3.800, pois vai vender 180 sacas a $90 e as 20 sacas restantes vão para o lixo. Mas, e se esse produtor pudesse definir o preço para essa safra de arroz no início do plantio, isto é, em t=0?

Suponha então que esse mesmo produtor venda contratos futuros de arroz por $95 a saca com a garantia de entrega da mercadoria em t=120. Os consumidores não sabem ao certo qual será o peço de mercado da saca de arroz no final do ciclo, mas, se acreditam que será maior que $95, eles desejarão comprar o contrato futuro que garante o preço de $95. O produtor, por sua vez, garante que conseguirá vender a saca de arroz a $95 no final da safra não importam as condições de mercado em t=120 e produz a quantidade ótima a esse preço, 190 sacas. O produtor está, portanto, protegido.

Os mercados evoluíram e hoje existem diferentes tipos de derivativos, muitos deles padronizados e negociados em bolsa, que podem ser usados para proteção, especulação e até mesmo arbitragem. Observe que como os derivativos são derivados de outros ativos, a posse de um derivativo não significa a posse do ativo em si, mas sim uma obrigação de compra ou venda – swaps, futuros e contratos a termo – ou direitos de compra e venda – opções – em uma data futura pré-estabelecida.

Existe uma série de páginas na internet descrevendo os diferentes tipos de derivativos, mas segue abaixo um resumo que será útil para as explicações que virão em seguida.

Contratos a Termo

Contratos a termo são provavelmente os derivativos mais simples: quem compra um contrato a termo se compromete a comprar uma determinada quantidade do ativo a um preço pré-estabelecido e com data futura de liquidação definida (quem vende um contrato assume o compromisso contrário). Se uma das partes desiste da negociação antes do prazo, ela ainda assim permanece vinculada ao contrato até a sua efetivação e consequente liquidação.

A liquidação desses contratos pode ser física (entrega do ativo – saca de arroz, por exemplo) ou financeira (pagamento do valor acordado) e as negociações a termo acontecem tanto no mercado de balcão organizado quanto na bolsa de valores. Na bolsa de valores, os contratos a termo mais comuns são os de ações.

Contratos Futuros

O mercado futuro é como uma evolução do mercado a termo, a principal diferença entre eles é que no mercado a termo o preço negociado é fixo, ao passo que a cotação no mercado futuro vai se ajustando ao longo do tempo até a liquidação do ativo. Além disso, contratos futuros são sempre padronizados e negociados em bolsa.

O comprador (ou vendedor) de um contrato futuro assume a obrigação de comprar (ou vender) o ativo objeto quando o contrato expirar ao preço pré-estabelecido, não importando o preço de mercado do ativo nada de vencimento do contrato. No mercado futuro, os investidores podem comprar e vender contratos antes do prazo (transferindo a obrigação), o que torna esse tipo de derivativo mais líquido que os contratos a termo, e concretizar lucros e perdas diários, já que os contratos futuros são ajustados diariamente.

Swaps

Resumidamente, swaps são contratos entre duas contrapartes que definem um fluxo de caixa entre estas, baseadas em uma regra acordada. Os swaps mais comuns negociam a troca de rentabilidade entre dois ativos baseados em um valor de referência, uma troca de riscos. Suponha um contrato de swap de Ibovespa contra a taxa DI: se na data do vencimento o DI tiver uma variação superior a do Ibovespa, o investidor que está comprado em DI no swap receberá a o fluxo de caixa referente à diferença de rentabilidade.

Os swaps mais populares no mercado financeiro são os que envolvem índices, taxas de juros e moedas. O Banco Central brasileiro costuma fazer operações de swap cambial para controlar o câmbio (real versus dólar). Nesse caso, a contraparte dos contratos são as instituições financeiras e empresas que têm dívidas e dólar e desejam se proteger das variações do real. Se o Bacen deseja equilibrar o mercado de câmbio diante de uma desvalorização do real, ele vai se comprometer a pagar a variação cambial do período do contrato enquanto as outras partes pagam uma taxa de juros, ou seja, a autoridade monetária compra o swap, ficando ativo em taxa de juros e passivo em câmbio.

Opções

Opções são contratos entre duas partes que dão aos seus detentores o direito de comprar o ativo-objeto a um dado preço (preço de exercício) e dentro de um certo período de tempo. O mercado de opções é fundamentalmente diferente dos mercados descritos anteriormente, pois nele a negociação é sobre o direito, e não a obrigação, de comprar ou vender um ativo a um determinado preço em uma data futura.

Existem dois tipos de opções: de compra (call) e de venda (put). Tipicamente, os contratos de opções são bastante curtos, com expiração em 30, 60, ou 90 dias. Um investidor que acredita que uma determinada ação vai se valorizar nos próximos dias pode comprar uma opção de compra dessa ação. Nesse caso, se a valorização se concretizar, ele pode exercer o direito de compra ao preço pré-estabelecido e revender no mercado à vista ao preço de mercado, lucrado a diferença entre o preço de exercício e o preço de mercado.

Se a valorização não acontecer, o investidor pode simplesmente não exercer seu direito e perder apenas o preço pago pelo contrato, chamado prêmio, definido a partir da relação entre seu valor intrínseco (que leva em conta taxa juros, prazo e vencimento) e seu valor extrínseco (influenciado pelo risco do ativo-objeto). O prêmio de uma opção é geralmente maior quanto mais distante for o vencimento e/ou quanto maior for a volatilidade implícita do contrato.

Por que derivativos são negociados?

Uma vantagem óbvia mercado de derivativos é a proteção de produtores durantes as safras/ciclos de commodity. Entretanto, atualmente a maior parte dos contratos derivativos negociados não envolve liquidação física, isto é, não envolvem a entrega do ativo objeto fisicamente (um barril de petróleo no porto, por exemplo). O que ocorre é a liquidação financeira dos contratos e apenas a troca de fluxos de caixa. Nesse contexto, quais as vantagens de negociar derivativos?

Primeiro, derivativos permitem desenhos de payoffs mais sofisticados. Usando opções, por exemplo, é possível construir uma estratégia com perda limitada e ganho ilimitado a partir da variação do preço do ativo-objeto. Pense em um investidor não tem certeza sobre a direção do movimento de uma ação, mas ele tem certeza que haverá uma variação em função de um evento político, por exemplo. Esse investidor pode comprar uma opção de compra e uma opção de venda da ação ao mesmo tempo, com o mesmo preço de exercício e mesma data de vencimento. Assim, se o preço subir (cair) após o evento ele exerce a opção de compra (venda) e deixa a opção de venda (compra) expirar. Por outro lado, se o preço ficar parado o investidor pode simplesmente deixar as duas opções expirarem.

Como as opções são apenas direitos de compra ou venda sobre ação, quando o investidor não exerce as opções a perda dele é limitada no valor do prêmio do contrato, enquanto o ganho é ilimitado e depende apenas da diferença entre o preço de exercício e o preço de mercado da ação na data de exercício. Chamamos esse tipo de estratégia de straddle. Se esse mesmo investidor não investisse em derivativos, mas ainda assim quisesse apostar na variação de preço da ação no mercado à vista, ele teria que fazer uma série de operações complexas, arriscadas e potencialmente mais caras para replicar o payoff de “ganho ilimitado e perda limitada” da estratégia de straddle.

Segundo, derivativos podem ser usados para hedgear posições, ou seja, reduzir o risco de um determinado investimento. Contratos futuros são comumente usados para hedge. Suponha um investidor brasileiro que tenha um portfólio (em reais) com exposição cambial a dólar, isto é, cujo valor varia não só em função das posições da carteira, mas também em função da variação no câmbio dólar/real. Se há uma apreciação cambial do real frente ao dólar, é como se o portfólio tivesse sofrido uma desvalorização, uma vez que o portfólio é cotado em reais.

Esse investidor poderia se proteger da variação cambial vendendo uma quantidade de contratos futuros de dólar equivalente à exposição da sua carteira. Como futuros são contratos padronizados, negociados em bolsa e cotados diariamente, ao vender futuros de dólar o investidor garante que a qualquer momento ele consegue liquidar a posição em dólar e obter apenas a performance das posições, sem influência do câmbio. Em outras palavras, a posição vendida em dólar sofre uma valorização com apreciação do câmbio que contrabalanceia exatamente a desvalorização do portfólio, de forma que no momento da liquidação (do portfólio em dólar para real e dos contratos futuros de dólar) o fluxo de caixa resultante não depende da cotação do câmbio.

Terceiro, é possível explorar oportunidades de arbitragem entre os mercados derivativos e os mercados à vista. Oportunidades de arbitragem podem ser definidas como situações em que é possível lucrar a partir de diferenças/distorções no preço de um ativo em diferentes mercados. Suponha um ativo negociado a $10 no mercado à vista, ao passo que o contrato futuro sobre esse ativo, com vencimento em um mês, é negociado é negociado a $12. Assuma que não exista nenhum custo associado a armazenamento e financiamento do ativo-objeto, por exemplo.

Nesse caso, uma estratégia de arbitragem seria comprar o ativo a $10 e simultaneamente vender (a descoberto) o futuro a $12. Se o investidor mantivesse a posição até a expiração do contrato futuro, ele poderia entregar o ativo comprado a $10 e obter um lucro (quase sem risco) de $2. Chamamos esse tipo de estratégia de “cash-and-carry arbitrage” porque a ideia é carregar (carry) o ativo para entregar na data do vencimento do futuro.

Por fim, uma grande vantagem do mercado de derivativos é a possibilidade de operar alavancado. Isso significa que o investidor consegue uma exposição financeira maior do que o patrimônio líquido investido. Em outras palavras, é possível investir uma quantidade de dinheiro maior do que a que se tem em conta. Mas isso não vem sem risco. Ao mesmo tempo que operar alavancado pode representar um aumento de patrimônio, o prejuízo pode ser catastrófico se as expectativas não se concretizarem. Em função disso, investidores de derivativos precisam manter um volume de dinheiro em margem que reflita sua exposição ao risco dos contratos e possa ser usado para cobrir eventuais perdas.

Derivativos surgiram da necessidade dos detentores de ativos se protegerem, evoluíram para diferentes tipos de contratos formalizados e passaram a ser usados em estratégias de investimento sofisticadas. Hoje, o mercado de derivativos é também um termômetro de incertezas, já que esses ativos podem ser usados para proteção e oferecem oportunidades lucrativas mesmo em períodos de forte instabilidade, o que torna esse mercado bastante sensível às expectativas dos investidores sobre o futuro. Divertido, não? É por tudo isso que derivativos existem.

Fenômenos Emergentes: Jogo da Vida e Preços de Mercado

Daemon Investments — Wed, 26 Jan 2022 20:34:03 +0000

Um texto sobre como fenômenos complexos podem parecer simples, na vida e no mercado.

Por Gabriel Koike

Quando observamos o mundo através da nossa perspectiva humana, percebemos alguns fenômenos muito complexos por algumas lentes muito limitadas – seja em termos de espaço, tempo, frequências, amplitudes, dimensões ou estados. Entre alguns exemplos dessas limitações da nossa percepção estão a evolução das espécies através da seleção natural, mudanças climáticas globais causadas por ação humana, consciência da mente e preços de mercado. Todos esses exemplos são de fenômenos onde nossa percepção nos ilude – às vezes até fazendo o complexo parecer simples, quando na verdade são fenômenos inerentemente complexos. Sua complexidade surge de interações entre elementos – que muitas vezes seguem regras muito simples – mas que quando levadas em conta de forma sistêmica fazem o comportamento do todo ser muito mais complexo do que a soma das suas partes. Chamamos essa propriedade de emergência – complexidade emergente.

Para enxergar como isso acontece, podemos olhar alguns exemplos. Um dos exemplos mais clássicos e elegantes é o Jogo da Vida de Conway (Conway’s Game of Life). Este é um conjunto de sistemas modelados como autômatos celulares onde elementos seguem regras iguais, claras e bem conhecidas, mas que geram uma série de comportamentos emergentes quando observados como um todo – causando a impressão de que os elementos estão vivos.

O Jogo da Vida de Conway começa com uma série de elementos quadriculados – como posições em um tabuleiro de xadrez – que podem assumir dois estados: vivo ou morto. Definimos também um conjunto de regras bastante simples sobre a evolução dos sistemas a partir dos elementos. Para cada passo de tempo, olhamos o estado anterior e computamos o que acontece:

Se um elemento está vivo, mas cercado de menos de dois vizinhos vivos, ele morre. (Regra de escassez)
Se um elemento está vivo, cercado de dois a três vizinhos vivos, ele permanece vivo. (Regra de permanência)
Se um elemento está vivo, mas cercado de mais de três vizinhos vivos, ele morre. (Regra de sobre-população)
Se um elemento está morto, cercado de exatos três vizinhos vivos, ele nasce. (Regra de reprodução)

Para ilustrarmos, precisamos de condições iniciais de elementos vivos (preto) ou mortos (branco). Vamos supor olhar dois cenários simples, nas Figuras 1a e 1b.

A figura 1a é bastante simples: cada um dos elementos 2B, 2C, 3B e 3C, cada um, é vizinho de exatamente 3 elementos vivos. Portanto, esperamos que cada um deles permaneça vivo na próxima iteração. Da mesma forma, elementos ao redor que estão mortos não estão cercados de 3 vizinhos vivos e, portanto, permanecem mortos. A figura 1b é um pouco mais interessante. Notamos que os elementos 3B e 3D estão mortos, mas cercados de 3 elementos vivos (2C, 3C e 4C). Portanto, na próxima iteração estarão vivos. Os elementos 2C e 4C, por sua vez, mas são vizinhos apenas de 3C vivo. Nesse caso, estarão mortos na próxima iteração. E o elemento 3C, vivo, é vizinho de dois elementos vivos e, portanto, permanece vivo na próxima iteração. A segunda iteração, portanto, é mostrada na figura 2a e 2b.

Notamos que a figura 2a é idêntica à figura 1a. Este conjunto é estável, e não muda não importa quanto tempo passe. Já a figura 2b é um pouco diferente, mas semelhante a 1b – uma translação. Evidentemente na próxima iteração, os elementos da figura 2b formarão exatamente o mesmo padrão de 1b. Nesse caso, temos um oscilador de período 2.

Estes exemplos são bastante simples. Mas existem padrões muito mais complexos. Osciladores de períodos maiores, padrões “que andam”, padrões que geram outros padrões, entre outros. Na verdade, a complexidade deste sistema é incrível, e gerada a partir de apenas regras simples. A figura 3 é uma ilustração da complexidade deste sistema, em uma simulação.

Na verdade, este sistema é tão complexo que é chamado, na Teoria de Complexidade Computacional, de indecidível (undecidable) – é impossível a construção de um algoritmo que possa determinar de forma definitiva a posição final ou se o sistema é “infinito”, dada qualquer posição inicial. Este sistema se enquadra em uma classe de regras chamada Turing-Completa (Turing Complete) e isso é o análogo do Problema de Parada (Halting Problem).

O Jogo da Vida de Conway é fascinante, e dele tiramos alguns conceitos muito importantes para nosso mundo de matemática, modelagem e simulação:

A interação de diversos elementos, mesmo que seguindo regras simples, pode dar origem a fenômenos complexos em um “nível macro”.
Alguns fenômenos aparentemente imprevisíveis são apenas consequência de diversos elementos que interagem entre si com o tempo, mesmo que seguindo regras simples – ou podem ser modelados como tal.
Pequenas variações em condições iniciais de alguns sistemas podem gerar grandes diferenças, e aparentemente imprevisíveis, na evolução destes. Isto é uma propriedade, inclusive, de Sistemas Caóticos – apesar de não suficiente.

No primeiro parágrafo, citamos alguns exemplos de fenômenos emergentes – sob a ótica de nossa limitação em enxergar apenas algumas propriedades “macro” de forma intuitiva. Podemos ver como cada um deles se relaciona com estes conceitos.

Tanto a evolução das espécies através da seleção natural quanto mudanças climáticas são difíceis para nossa percepção porque nossas limitações de observação são limitadas a nossos dias, meses e anos, enquanto precisaríamos de centenas, milhares ou milhões de anos (no caso da evolução) para notar alguns destes efeitos. No entanto, sabemos de regras simples que elementos que compõem estes sistemas seguem – o clima pode ser modelado como pequenas células que seguem regras de temperaturas, pressões, humidade, composição de gases, troca de calor e composição atmosférica, e diversos fenômenos físicos.

Já a evolução de espécies por seleção natural foi desmistificada com a evolução da genética e validada com uma série de predições que a teoria faz. Em ambos os casos, o uso de modelagem e simulações pode ajudar a elucidar alguns conceitos e refinar o entendimento teórico. Já o pensamento e consciência humanas são fenômenos emergentes da interação de neurônios conectados através de sinapses, diversidade de dendritos, células especializadas, camadas de neurônios, regiões funcionais de células e a interação entre as diversas regiões.

Em todos estes exemplos, ainda há muito a ser refinado – mas o conhecimento científico sobre estes temas progrediu muito com a compreensão de complexidade como fenômenos emergentes, além do uso extensivo de modelos matemáticos e simulações.

Por fim, mencionamos preços de mercado. Voltamos então ao nosso artigo de Microestruturas de Mercado. Com microestruturas de mercado, passamos a ver preços como consequências de interações entre compradores e vendedores, cada um com preços a que aceitam negociar ativos. Refraseando como o tema deste artigo: os preços de mercado também podem ser vistos (e modelados) como fenômenos emergentes, partindo-se de diversos elementos que negociam ativos. Cada elemento do sistema pode possuir um nível de informação (ou conhecimento) diferente, e busca maximizar seu retorno de acordo com seus critérios e limitações financeiras.

Compradores buscam comprar ativos ao menor preço possível. Se um comprador tem acesso a alguma informação que o leve a aceitar um preço a que um vendedor está disposto a vender, ocorre um negócio (trade). Da mesma forma, se um vendedor tem acesso a informação suficiente que o leve a aceitar vender pelo preço mais alto que está sendo pedido por compradores, ocorre um negócio. E assim, os preços de negócios se formam.

O sistema de compras e vendas é um leilão duplo – com preços de oferta e demanda (bid e ask). Há diversos participantes, mas nem todos os participantes são iguais. Existem modelos onde os participantes são diferenciados entre informados e não informados (informed trading vs uninformed trading). Além disso, participantes podem ter acessos aos preços com maior ou menor atraso. Por fim é bastante pertinente citar que há algoritmos que operam em mercados de forma razoavelmente previsível – como por exemplo um participante que execute grandes ordens de alguns ativos (como, por exemplo, durante um rebalanceamento de um índice de mercado) usando um algoritmo do tipo VWAP (Volume Weighted Average Price) ou TWAP (Time Weighted Average Price), ordens de stop automático ou mesmo grandes participantes fazendo operações de delta hedge.

Enquanto tudo isso acontece, os preços de negócios oscilam de forma imprevisível. Mesmo que todos os inúmeros participantes de mercado tivessem seus parâmetros perfeitamente conhecidos – preferências, preços que aceitam compras ou vendas, nível de informação, atrasos etc. – os preços formados pela interação destes poderia ser incrivelmente complexa, e muito provavelmente um problema indecidível (como uma Máquina de Turing). Certamente com variações de parâmetros, os preços serão imprevisíveis. E ao mesmo tempo, alguns participantes de mercado buscam padrões geométricos em gráficos formados por estes preços para tomar as suas próprias decisões, na vida real.

Modelos econométricos em geral representam retornos de mercado como séries temporais sequenciais de variáveis aleatórias, com diversos níveis de sofisticação e com diferentes propriedades matemáticas, apesar de buscarem representar um conjunto semelhante de fatos estilizados. Boa parte dos modelos de retornos de mercado são tais que preços são Martingales (sequências de variáveis aleatórias tais que a expectativa condicional do próximo preço é o próprio preço anterior) ou representam ativos como regressões lineares (ou até regressões mais sofisticadas), com relação a um índice de mercado ou mesmo a outros ativos – como mostramos no nosso artigo de Cointegração.

Modelos de microestrutura e representações de elementos simples interagindo em uma rede complexa, tais que preços ou retornos surgem como fenômenos emergentes, também podem dar origem a preços e retornos que se comportam de formas semelhantes a modelos econométricos. Inclusive, é possível observar quais premissas sobre os elementos são necessárias para dar origens a Martingales, a ativos correlacionados ou a outros tipos de fenômenos. E um dos grandes valores desse tipo de conhecimento é entender as limitações ou as condições que precisam ser satisfeitas (como limitações sobre liquidez, atrasos, assimetria de informação) para que alguns modelos econométricos sejam boas representações.

Complexidade como um fenômeno emergente é um tema fascinante. Sob o ponto de vista matemático, é incrível ver como elementos simples podem interagir de forma a gerar comportamentos tão complexos e ricos. Esta forma “bottom-up” de ver alguns fenômenos é uma ferramenta poderosíssima, que nos permite desenvolver ou refinar teorias, ver similaridades e analogias entre diferentes áreas do conhecimento. É mais uma ferramenta que devemos ter em nosso repertório. Esta ferramenta requer grande capacidade de análise e simulação, mas ao mesmo tempo ilumina nosso entendimento de nossos modelos e confiança nestes, com uma capacidade não atingida quando olhamos o mundo “top-down”.

Leia também o texto “Tempo, Natal, e Microestruturas de Mercado”.

Carta do Gestor Janeiro 2022

Daemon Investments — Thu, 06 Jan 2022 13:21:25 +0000

Mesmo em condições adversas, transitórias e estruturais do mercado brasileiro, a diversificação aplicada a nossa gestão quantitativa se mostrou adequada e resiliente no último trimestre.

O retorno do nosso fundo quant Daemon Nous Global foi 5,63% no trimestre, fechando 2021 com um retorno total de 18,37% e um índice de sharpe de 1.30. O resultado acumulado desde o lançamento do fundo é de 44,73%.

Isso só prova o quanto a nossa estratégia de descorrelação com o mercado brasileiro segue funcionando perfeitamente, como mostra a análise realizada pelo nosso sócio-fundador Sérgio Rhein Schirato, na Carta do Gestor de janeiro.

Acesse aqui

Tempo, Natal e Microestruturas de Mercado.

Daemon Investments — Wed, 22 Dec 2021 13:23:29 +0000

Um artigo sobre como o processo de formação de preços no mercado financeiro não é tão simples quanto parece.

Por Hully Rolemberg

Dezembro chegou e com ele o sentimento natalino de que o ano passou rápido demais. De 01/01/2021 a 01/12/2021 foram 1816 horas de negociação na B3, aproximadamente 1,40 bilhões de negócios fechados e 1,98 trilhões de reais transacionados. Tudo isso só na bolsa brasileira – que hoje representa menos de 1% do mercado financeiro global. Fisicamente, é impossível que o intervalo entre os minutos tenha sido de fato menor que 60 segundos ou que o tempo tenha passado mais rápido em 2021 do que nos anos anteriores. Mas, a nossa percepção de tempo acaba sendo distorcida em função do número de eventos que ocorrem nesse intervalo de 60 segundos e a verdade é que esse número só cresce a cada ano.

Quanto mais eventos ocorrem, mais dados são gerados e mais sofisticadas são as infraestruturas necessárias para coletar e armazenar essas informações. Do nosso artigo “Ciência de Dados em Fundos Quantitativos“, você sabe que dados são os insumos essenciais dos algoritmos e que sem eles nós (quants) nada somos. A partir dos dados de mercado, nós processamos sinais, estimamos modelos estatísticos/matemáticos e construímos estratégias sistemáticas de investimento. Por isso, para que os nossos modelos produzam resultados robustos, é muito importante que os dados sejam coletados e armazenados de maneira correta e eficiente, refletindo as condições de mercado da época.

No nosso artigo “Estatística, Astrologia e Eficiência de Mercado”, nós falamos sobre como modelos são apenas aproximações da realidade e, portanto, válidos apenas sob algumas hipóteses simplificadoras. Essas hipóteses são geralmente sobre o comportamento dos agentes (racionais e homogêneos) e sobre os dados de mercado (informação completa e séries independentes e identicamente distribuídas). Neste artigo, nós vamos explorar algumas condições de mercado que não são contempladas pela Hipótese de Eficiência do Mercado (em sua versão original) e que têm se tornado cada vez mais relevantes com a modernização das bolsas e sistemas de trading. Chamamos o ramo da literatura que estuda essas condições de “Microestrutura de Mercado”.

Os estudos de microestrutura de mercado buscam analisar, entre outras coisas, questões relacionados à formação e descoberta de preços, custos de transação e comportamento dos investidores. Se por um lado, o framework de mercados informacionalmente eficientes assume que os preços devem refletir toda a informação disponível, a análise de microestrutura, por outro, mostra que a formação dos preços não é trivial e que, na verdade, está sujeita a algumas fricções transacionais. Nesse sentido, avaliar como os mecanismos de trading e o comportamento dos agentes afetam os preços nos ajuda encontrar oportunidades de lucro que existem no mundo real, mas que não necessariamente são explicadas pela Hipótese de Eficiência do Mercado.

Como ilustração, suponha que estejamos interessados em desenvolver uma estratégia de pairs trading entre duas ações a partir de um modelo cointegrado (explicamos o que é cointegração no artigo “Cointegração: o bêbado e o cachorro”). Nesse caso, nós devemos identificar pares de ações que possuem uma relação de longo prazo, estimar essa relação e aplicar uma estratégia do tipo long/short. Para isso, precisamos de dados históricos, em particular, preços históricos igualmente espaçados no tempo. Isso significa que os dados devem estar amostrados em alguma frequência fixa: mensal, diária ou por minuto, por exemplo. Fácil? Sim. Representativo da realidade? Nem tanto.

Pense numa série de preços qualquer. O preço de um ativo a cada dia pode ser representado pelo seu preço de fechamento, ou seja, o preço do último negócio do dia. Observe que o preço de fechamento de um dia nem sempre ocorre exatamente 24h depois do preço de fechamento do dia anterior, mas ainda assim essa série temporal seria classificada como uma série diária. Seguindo essa lógica, bastaria coletar o último preço de um determinado intervalo de tempo qualquer para obter uma série de dados igualmente espaçada.

O problema é que nem sempre os ativos são negociados igualmente ao longo do tempo e em alguns períodos eles nem são negociados! Por isso, qualquer método que nós usemos para obter séries com frequências fixas nada mais é do que uma aproximação. Se o número de negócios não for distribuído uniformemente no tempo, então alguns períodos vão ter muito mais negócios do que outros e, ao considerarmos o último preço de cada minuto, por exemplo, estaremos assumindo que o dado do minuto 1 é tão representativo quanto o dado do minuto 2, o que não necessariamente é verdade.

Períodos em que não ocorrem negócios são particularmente problemáticos e induzem potenciais vieses nas estatísticas dos retornos, como médias, variâncias, covariâncias, betas e correlação. Pense no seguinte: o ativo A e o ativo B são independentes no tempo, mas A é negociado mais frequentemente que B; se chega uma notícia que afeta o mercado no fim do pregão, é mais provável que o preço de fechamento do ativo A reflita essa informação do que o preço de B, simplesmente porque B talvez não seja negociado depois que a notícia chegou. É certo que o preço de B vai refletir a nova informação em algum momento, mas o fato de isso ocorrer com atraso faz com que exista uma autocorrelação cruzada entre os retornos diários de A e B quando calculados usando preços de fechamento. Chamamos esse efeito de “Nonsynchronous Trading”.

Com o avanço tecnológico e consequente modernização das bolsas, praticamente todo o volume de negócios financeiros no mundo é feito eletronicamente e numa velocidade praticamente impensável poucos anos atrás. Assim, não importa o quão precisos nós tentemos ser na coleta e armazenamento dos dados de mercado – usando intervalos de segundos, nanossegundos ou microssegundos – o processo de modelar um fenômeno econômico sempre implicará a perda de alguma característica dos dados, afinal um modelo é basicamente uma simplificação da realidade e, portanto, tem limitações.

O próprio processo de trading pode ter um impacto importante nas propriedades estatísticas dos preços. Em mercados dinâmicos, por exemplo, high frequency trading é parte relevante do volume total de negócios e os denominados “market makers” têm papel importante em fomentar a liquidez do mercado. Resumidamente, os market makers são agentes, devidamente cadastrados na bolsa em que atuam, que se comprometem a comprar e vender ativos, provendo liquidez para o mercado e lucrando em cima do bid-ask spread. Nesse contexto, a existência de um spread entre o preço que o market maker desejaria comprar (bid) e o preço que ele desejaria vender (ask) pode ter um impacto não desprezível na correlação serial dos retornos, o que certamente impactaria a estimação de qualquer modelo financeiro convencional.

A existência de um bid-ask spread cria um viés nos retornos, pois ao invés de um preço único, nós temos 3: o preço de compra, o preço de venda, e o preço da transação (que não necessariamente é o preço de compra ou o de venda). Como os retornos deveriam ser calculados então? De um preço de compra a outro preço de compra, de um preço de venda a um preço de compra, de um preço de venda a outro preço de venda, etc.? Além disso, quando chegam ordens de compra e venda aleatoriamente no mercado, o preço pode oscilar para cima e para baixo entre o preço de compra e o preço de venda (bid-ask bounce), criando uma volatilidade espúria (leia o nosso artigo “Volatilidade: qualidade do que é volátil” para entender mais sobre a estimação da volatilidade) e autocorrelação nos retornos, mesmo que o preço do ativo no fim das contas permaneça o mesmo.

Para alguns propósitos, como os que envolvem investimentos de longo prazo, o impacto das microestruturas de mercado pode ser ignorado sem muito prejuízo estatístico. Para outros, microestrutura é exatamente o tema central (pense em análises de liquidez). Logo, estudos empíricos interessados em endereçar esses fenômenos de mercado devem usar “dados de transações” e não os convencionais “dados de preço”. Isto é, ao invés de agregar os dados temporalmente em um único preço, todos os negócios devem ser levados em conta na construção dos modelos.

Em uma base de dados de transações (também denominados “dados de tick“), o preço de cada negócio é registrado e armazenado com o timestamp do momento exato em que ocorreu o negócio. Esse timestamp pode ter diferentes níveis de precisão: dias, horas, minutos, segundos, milissegundos, e por aí vai. É verdade que, mesmo que os dados sejam registrados com um alto nível de precisão no tempo, isso ainda será uma aproximação, pois mais de um negócio podem ser fechados no mesmo instante de tempo, cada um a um preço diferente e, então, a decisão de qual preço usar é (novamente) uma simplificação da realidade, mas dessa vez bem mais elegante.

O problema com os dados de transações, é que uma transação não é igual a outra, principalmente em termos de volume transacionado. Uma solução alternativa seria às “barras de tempo” seria utilizar “barras de volume” ou “barras de volume financeiro” (dollar bars). No primeiro caso, os intervalos são definidos com base no número de contratos negociados – a cada 1000 ações, por exemplo. Já no segundo, os intervalos dependem do volume financeiro transacionado – a cada R$1.000.000,00, por exemplo. A barras de volume financeiro tendem a ser a solução mais robusta para o problema de Nonsychronous Trading, principalmente em mercados muito voláteis. A amostragem por volume financeiro favorece a integridade dos dados, preservando propriedades estatísticas das séries (como a volatilidade “intraperíodo”). Além disso, as dollar bars são robustas a mudanças na quantidade total dos ativos no mercado, como as que acontecem em eventos corporativos de splits e inplits.

Atualmente, dados de transações financeiras estão amplamente disponíveis (nem sempre gratuitamente) para pesquisadores e agentes do mercado que desejem investigar questões de microestruturas como: Quais os determinantes do bid-ask spread? Quais os fatores que explicam o comportamento dos market makers? O processo de trading em si impacta os preços? Como isso varia em função do tamanho do trade? Quais os benefícios e custos de requerimentos de margem e de volatilidade intradiária? Todas essas questões são ignoradas por boa parte dos modelos financeiros, mas com o aumento da velocidade do mercado, cada vez mais esses detalhes passam a ser explorados como oportunidades de lucro. Se antes fazia sentido pensar em um ativo sendo transacionado uma vez por minuto, agora esse número pode chegar a centenas de vezes por segundo, nunca o tempo passou tão rápido!

Fundos quantitativos conseguem surfar mais facilmente nessa onda de aceleração do tempo, afinal os algoritmos são escaláveis e conseguem acompanhar o aumento no volume e na velocidade dos dados. Além disso, a estrutura de bancos de dados utilizados pelos quants tem se tornado cada vez mais sofisticada para acompanhar todos esses avanços. Dados intradiários, dados em tempo real, dados vintage. Preços, volumes, eventos corporativos, ratios. Toda a informação relevante precisa ser armazenada de maneira eficiente para que os modelos possam ser estimados com a melhor informação possível. Os modelos, por sua vez, são refinados para comportar as novas condições de mercado e continuar gerando retorno esperado positivo. A matemática é mesmo fascinante.

Tão fascinante quanto a nossa perspectiva sobre a passagem do tempo: dezembro chegou logo depois de julho, 2021 ainda soa como uma continuação de 2020, as semanas parecem que têm menos de 7 dias (a semana entre o Natal e o Ano Novo, em particular, tem 3)… O que esperar de 2022? Os investidores podem esperar mercados ainda mais rápidos, cada vez mais eventos ocorrendo num intervalo de 1 minuto, ainda mais negócios sendo fechados, ainda mais dados sendo gerados e muitos efeitos de microestruturas de mercado para serem capturados.

Cointegração: o bêbado e o cachorro

Daemon Investments — Tue, 16 Nov 2021 18:04:28 +0000

Um texto sobre como uma relação estatística entre as trajetórias de um cachorro e seu dono pode ser aplicada em estratégias de investimento.

Por Hully Rolemberg

Você muito provavelmente já ouviu falar de “correlação” e sabe formular uma definição intuitiva sobre esse conceito: correlação significa uma relação entre duas coisas. O fato é que existe um “refinamento” da ideia de correlação que nos permite avaliar relações de longo prazo e obter insights mais profundos sobre o comportamento conjunto de duas variáveis, é o que chamamos de cointegração.

Por trás da definição de cointegração, há uma extensa literatura estatística sobre estacionariedade, raízes unitárias, modelos autorregressivos etc. Mas, como o meu objetivo nunca é te entediar com fórmulas matemáticas e explicações rebuscadas, hoje vou pular alguns passos e te explicar o que é cointegração usando uma adaptação de Murray (1994) sobre o bêbado e o cachorro.

Inicialmente, imagine um bêbado que acaba de sair do bar, ele caminha em uma rua plana tentando chegar em casa. Toda vez que o bêbado caminha para frente, ele pode tombar para esquerda ou para a direita com probabilidades iguais. Dizemos então que a trajetória dele segue um “passeio aleatório”, ou seja, é uma sucessão de passos aleatórios.

Bêbados não são os únicos com comportamentos desse tipo, cães também podem agir assim: cada cheiro que passa aleatoriamente pelo nariz do cachorro determina a direção do seu próximo passo. Com isso em mente, suponha que um cachorro (que a princípio não pertence ao bêbado) saia do bar no mesmo instante que o bêbado. As trajetórias do bêbado (𝑥) e do cachorro (𝑦) podem ser modeladas da seguinte forma:

onde u_t e w_t são os passos aleatórios que o bêbado e o cachorro dão no instante t. Esses passos seguem, por hipótese, um processo estocástico do tipo ruído branco, isto é, estacionário e não autocorrelacionado. Graficamente, podemos ilustrar essa situação da seguinte forma: o eixo horizontal representa o tempo e o eixo vertical a localização, de forma que o bar está localizado no ponto zero do eixo vertical (veja a figura abaixo).

Uma característica importante de processos do tipo passeio aleatório é que o último valor observado é a melhor previsão para os valores futuros. Isso ocorre porque o próximo ponto é exatamente o anterior mais um erro aleatório. Sendo assim, se me perguntassem onde estão o bêbado e o cachorro agora, a minha melhor resposta seria dizer que eles estão no último lugar onde eu os vi: no bar.

Observe que, como passeios aleatórios são processos não-estacionários (integrados de ordem 1), quanto mais tempo passa, maiores são as chances de o bêbado e o cachorro estarem longe de onde eles foram vistos pela última vez (no bar) e, além disso, maiores as chances de estarem distantes um do outro. Mas, e se o cão pertencer ao bêbado?

Suponha então que o cão pertence ao bêbado. O bêbado e o cachorro saem do bar e seguem (individualmente) passeios aleatórios, mas eventualmente o dono chama o cão: “Ethos!”. O cão entende que não pode se afastar demais do dono senão ficará trancado para fora de casa, e o bêbado entende que não pode deixar o cão ir muito longe senão vai acordar com o seu latido do lado de fora de casa. Sendo assim, tanto o cão quanto o bêbado passam a caminhar de forma a não se afastarem demais, sempre corrigindo a distância entre eles. Agora, as trajetórias do bêbado e do cão não seguem mais processos do tipo passeio aleatório, pois incluem um termo de correção de erro que impede que os dois se afastem demais um do outro. Uma possível representação gráfica, nesse caso, seria a seguinte:

Observe que tanto o cão quanto o dono continuam dando passos aleatórios para esquerda e para a direita ao longo do caminho e, conforme o tempo passa, a probabilidade de eles estarem longe do bar cresce. Ou seja, apesar de as novas trajetórias não seguirem (conjuntamente) processos do tipo passeio aleatório, elas ainda são não-estacionárias.

Sabendo que o cão pertence ao bêbado, nosso melhor chute agora é dizer que uma vez encontrado o bêbado, o cão não deve estar muito longe (e vice-versa). Se isso for verdade, então a distância entre as duas trajetórias é estacionária e a caminhada do bêbado e do cachorro são cointegradas de ordem zero (essa definição será explicada a seguir).

Lembre-se de que o cão não está preso a uma coleira que o força a estar uma distância fixa de seu dono. A distância entre ele e o bêbado é, na verdade, uma variável aleatória estacionária, apesar da não-estacionariedade das trajetórias. Uma pausa para algumas explicações teóricas. Processos não-estacionários que se tornam estacionários quando diferenciado n vezes são chamados “integrados de ordem n”. Para que um conjunto de séries “cointegre”, é necessário que todas as séries sejam integradas da mesma ordem e que exista uma combinação linear (com pesos não nulos) entre elas tal que o resultado seja integrado de ordem menor que a das séries originais.

Intuitivamente, cointegração é um conceito probabilístico que define uma relação de longo prazo entre duas variáveis. Nós podemos modelar as trajetórias cointegradas do bêbado e de seu cachorro da seguinte forma:

onde u_t e w_t continuam sendo os passos do bêbado e do cão. O segundo termo do lado direito de cada equação é o termo de correção de erro segundo o qual o cachorro e o bêbado provavelmente não vão se afastar muito um do outro. Do sistema acima, deduzimos que a relação de cointegração entre y e x é (x_t-1 – y_t-1).

Note que se os termos de correção de erro não fossem estacionários, então os passos do bêbado e do seu cachorro também não seriam estacionários e então eles caminhariam para longe um do outro mesmo que se esforçassem para ficarem juntos. Sendo assim, se o bêbado e seu cão seguem trajetórias integradas de ordem 1 e consistentes com o sistema de equações descrito anteriormente, então as trajetórias devem cointegrar.

Mesmo valores pequenos de (c+d) têm efeitos significativos em reduzir a distância entre o bêbado e seu cachorro. Os dois tentam balancear os seus passos dados os passos do outro, de forma que a soma das suas posições seja uma variável estacionária com média zero. Imagine que o bêbado e o cachorro não consigam balancear perfeitamente os seus passos, um deve ser mais pesado que o outro e isso afeta o tamanho do passo, por exemplo. Nesse caso, a variável estacionária seria a média ponderada das posições do homem e do cachorro.

Quando utilizamos variáveis não-estacionárias em modelos de regressão convencionais, podemos obter resultados enganosos. Isto é, como processos do tipo passeio aleatório são não estacionários, se quiséssemos usar a trajetória individual do cão como preditor da trajetória individual do bêbado, os resultados seriam potencialmente espúrios. O que fazer então para estimar modelos com séries não estacionárias?

A solução mais simples para esse problema seria identificar a ordem de integração das séries – as trajetórias do bêbado e do cão são integradas de ordem 1 – e estimar o modelo de interesse com as séries diferenciadas estacionárias – nesse exemplo, usando os passos do cão como preditores dos passos do bêbado. Todavia, ao fazer isso nós desprezamos as possíveis relações de longo prazo entre as séries, já que usamos as variáveis na forma de variação (de curto prazo).

Por outro lado, quando utilizamos as séries integradas e o respectivo vetor de cointegração, a especificação do modelo acaba sendo muito mais rica, permitindo identificar relações de longo prazo, tendências comuns, e efeitos de feedback, por exemplo. Modelos desse tipo, conhecidos como Cointegrated VAR¹ ou VEC², são até hoje uns dos mais usados por economistas e econometristas, pois permitem combinar informação de longo e curto prazo nos dados a partir da propriedade de cointegração.

A anedota do bêbado e seu cachorro é uma boa ilustração dos conceitos de cointegração e correção de erro, e mostra que, ao contrário de outras definições econométricas, cointegração não é meramente uma conveniência estatística, mas sim uma propriedade das séries com conteúdo comportamental relevante! É verdade que a teoria econômica não nos ajuda a prever os passos aleatórios do cão e de seu dono (comportamento de curto prazo entre as variáveis), mas traz importantes insights sobre a relação de longo prazo entre as duas trajetórias.

A ideia de cointegração, apesar de ser mais disseminada na macroeconomia, pode ser usada no mercado financeiro para identificar relações de dependência entre ativos e operar (lucrativamente) em cima disso. De fato, “tentar modelar relações complexas de interdependência entre ativos financeiros apenas com o conceito de correlação é como tentar surfar na internet com um IBM AT”³ (Carol Alexander). A relação de cointegração descreve a distância entre dois ativos ao longo do tempo, enquanto a correlação simples descreve apenas a tendência de movimento em direções semelhantes.

Uma aplicação importante de cointegração em finanças são as estratégias de pairs trading. Nesse tipo de estratégia, uma posição comprada é “pareada” com uma posição vendida de duas ações fortemente correlacionadas (cointegradas). Com isso é possível estabelecer uma posição market neutral, ou seja, que gera retorno independentemente das condições de mercado contanto que a posição comprada suba mais que a posição vendida ou que a posição vendida caia mais do que a posição comprada. Suponha uma estratégia em que os dois ativos pareados são o cão e o bêbado. Uma estratégia de pairs trading aposta que no longo prazo o as trajetórias do cão e do bêbado vão convergir e, portanto, opera exatamente o vetor de cointegração entre eles [1,-1].

Duas ações de um mesmo setor ou duas ações de competidores diretos são altamente correlacionadas (cointegradas) e, portanto, fortes candidatos para pairs trading. Um exemplo de pares seria Vale e CSN Mineração, ambas do setor de mineração. Suponha que você deseje montar uma estratégia pares com VALE3 e CSNA3 e que você tenha certeza que a Vale vai performar melhor do que a CSN. A partir disso, você poderia montar uma posição market neutral comprando Vale e vendendo CSN (com pesos iguais). Mesmo que as duas ações caíssem, contanto que CSNA3 caia mais que VALE3, esse será um negócio lucrativo.

No geral, existem dois tipos pairs trading: um baseado em arbitragem estatística (long/short) e o outro em valuations fundamentalistas (compra ativos baratos e vende ativos caros). No caso de estratégias fundamentalistas, geralmente os ativos são pareados de forma que a ponta long tenha o mesmo número de ativos por setor que a ponta short. Já no caso de estratégias de arbitragem estatística, encontrar os pares de ativos é um desafio por si só.

Você já sabe que fundos quantitativos usam algoritmos e que, por isso, ganham escala na análise de dados, sendo capazes analisar um conjunto de ativos muito maior do que os fundos discricionários tradicionais, por exemplo. Nesse sentido, os quants acabam tendo uma vantagem na hora de identificar potenciais pares de ativos e conseguem implementar estratégias baseadas em arbitragem estatística mais eficientes.

1: Os modelos do tipo VAR (Vector Autorregressive) são o análogo vetorial/multivariado dos modelos autorregressivos (AR).

2: Os modelos do tipo VEC (Vector Error Correction) são o análogo vetorial/multivariado dos modelos de correção de erro (ECM) e podem ser entendidos como modelos do tipo VAR cointegrados.

3: “O IBM Personal Computer/AT (IBM 5170), mais conhecido como IBM AT e também chamado às vezes de PC AT ou PC/AT, foi o computador de segunda geração da IBM, construído com o microprocessador 80286 da Intel a funcionar a 6 MHz (8 Mhz em versões posteriores) e foi posto à venda em 1984 e descontinuado em 1987 por causa do lançamento dos computadores IBM PS/2.” (fonte Wikipedia).

Saiba mais sobre “Pairs Trade”