You are on page 1of 23

Estudo do desempenho de um clube da Série A do Campeonato

Brasileiro de Futebol

Daniel Almeida, Gabriel Sendacz, Guilherme Mendes, Mário Guercio, Philippe


Ricciardi e Solomon Torres.

Trabalho entregue ao
professor Sérgio Martins, da
disciplina de Econometria

São Paulo

2012
Sumário

Resumo.................................................................................................................Pág.2

Introdução.............................................................................................................Pág.3

Literatura...............................................................................................................Pág.5

Análise Descritiva..................................................................................................Pág.6

Modelo................................................................................................................Pág.19

Conclusão...........................................................................................................Pág.

Referências Bibliográficas..................................................................................Pág.

Apêndice.............................................................................................................Pág.

1
Resumo

A partir do paper “Demand for Brazilian Soccer: A CensoredModel Approach”, feito


por Adriana Bruscato Bortoluzzo, Pedro Trindade Iaropoli e Sérgio Jurandyr
Machado, buscamos desenvolver um modelo que estimasse o desempenho de um
clube de futebol no campeonato Brasileiro série A, de 2011.

Nossa intenção é avaliar a interação entre a variável resposta (desempenho) e suas


variáveis explicativas (que serão apresentadas em seguida) para auxiliar as tomadas
de decisão dos clubes e a formulação de estratégias. Com a análise das variáveis
explicativas é possível identificar quais fatores são mais relevantes para a conquista
de pontos, dessa forma o clube pode focar esforços para a melhoria desses fatores.

Com base nas variáveis: público pagante, valor em reais da folha de pagamento dos
jogadores, participação em outros campeonatos simultâneos ao Brasileirão,
desempenho passado e quantidade de troca de técnicos por campeonato,
estimamos o modelo inicial. Cada variável do modelo foi exposta a testes
estatísticos (que serão apresentados no decorrer do trabalho), para verificar sua
relevância na composição da equação. Pouco a pouco o modelo foi lapidado até
assumir sua forma final. O último modelo encontrado foi submetido a mais testes
estatísticos, testes White, Homocedasticidade e Reset, para então ser aprovado pelo
grupo.

A formulação do modelo e os métodos utilizados foram todos legitimados pelo uso


de análises e inferências estatísticas adequadas.

2
Introdução

Nosso estudo pretende analisar o desempenho esperado de um clube de


futebol que participe do Campeonato Brasileiro Série A do ano de 2011. Para
estimar o desempenho teremos como base as variáveis:

 Público presente nos estádios (apenas em jogos onde o clube for mandante
da partida);
 Participação em campeonatos internacionais (Dummy);
 Valor, em reais, da folha de pagamento dos jogadores e comissão técnica do
clube;
 Desempenho na edição passada do campeonato;
 Quantidade de técnicos que assumiram o time durante a competição;
 Interação entre o desempenho passado e participação em campeonatos
internacionais.

A variável “público presente” tem sinal esperado positivo. Espera-se que a


torcida impacte a favor do clube mandante, dado que ela incentiva o time e
pressiona o adversário. Da mesma forma, o salário dos jogadores também tem sinal
esperado positivo, pois se espera que quanto maior o salário do jogador, mais
habilidoso ele será. Ainda no grupo de variáveis com sinal esperado positivo, temos
“saldo de gols” e “desempenho passado”.
Quanto à variável “Quantidade de técnicos”, é esperado sinal negativo, devido
ao fato de que clubes que trocam demasiadamente de técnico geralmente estão
passando por crises. Tanto para a participação em campeonatos internacionais e
para a interação são esperados sinais positivos já que, em geral, os melhores times
que se classificam para tais competições.

Dessa forma, esperamos um modelo da seguinte forma:

Y = Xβ +ε

Sendo que Y corresponde à matriz de pontos conquistados pelos clubes


participantes durante o campeonato, X corresponde à matriz de dados referentes às
variáveis citadas acima, β corresponde à matriz de parâmetros de cada variável e ε
corresponde à matriz de erros associados ao modelo.

3
O estudo possui uma amostra de vinte clubes, que participaram da série A do
Campeonato Brasileiro no ano de 2011, sendo estes: América-MG, Atlético-PR,
Atlético-GO, Atléico-MG, Avaí, Bahia, Botafogo, Ceará, Corinthians, Coritiba,
Cruzeiro, Figueirense, Flamengo, Fluminense, Grêmio, Internacional, Palmeiras,
Santos, São Paulo e Vasco.
Infelizmente, não é possível estender a amostra para outros campeonatos,
Série B e Série C, por exemplo, pois são dados incomparáveis, dado que são
campeonatos diferentes.

Obs.: Todos os dados são anuais.

4
Literatura

Como referencia para o nosso estudo, temos o paper:“Demand for Brazilian


Soccer: A CensoredModel Approach”, feito por Adriana BruscatoBortoluzzo, Pedro
Trindade Iaropoli e Sérgio Jurandyr Machado:
O artigo tem como objetivo mensurar e estimar a demanda por jogos de
futebol nos estádios brasileiros. O modelo inclui variáveis relacionadas com o
ambiente econômico, a qualidade do produto oferecido e aos incentivos, tanto
monetários como não monetários, que a população tem para comparecer aos
estádios em dias de jogos. Para estimar a demanda, foramutilizados como base os
jogos da primeira divisão do Campeonato Brasileiro, entre os anos de 2004 a 2009.

O modelo utilizado no estudo foi o TOBIT, que é dado por:

Y = Xβ +ε

Onde Y é o publico pagante que compareceu nos jogos dos Campeonatos


Brasileiros de 2004 a 2009 e X é a matriz de variáveis explicativas no modelo. O
modelo foi estimado pelo estimador de máxima verossimilhança. O coeficiente de
determinação do modelo foi de 40%,sendo assim considerado adequado pelo ponto
de vista econométrico. O modelo foi ajustado com e sem o logaritmo natural da
demanda, de modo a verificar sua relação não linear com as variáveis explicativas.

Análise descritiva

Fizemos análises de cada variável explicativa em função da variável resposta,


a partir de métodos estatísticos que julgamos adequados. Analisamos regressões
(lineares simples), histogramas e box-plots. Os resultados estão expressos a seguir:

Obs.: Nas análises das equações de regressões, obtivemos valores de pontos decimais, o que é
válido numa análise estatística, ainda que na realidade, os times só possam somar valores inteiros.

5
- Público Presente (Jogos mandantes):

Regressão

Uma equipe que está indo bem na competição, com um bom número de
pontos somados, tende a gerar mais incentivo para seus torcedores comparecerem
nos estádios. Pela análise do gráfico de dispersão e da equação da linha de
tendência, observamos que essa relação é válida. Vale ressaltar o fato de que,
algumas torcidas têm um costume de comparecer nos estádios com mais volume
que outras, independente da situação do time, e também que alguns times tem
estádios com menor capacidade, restringindo o público que deseja acompanhar os
jogos nos estádios.

Assim como esperado, o sinal do estimador do parâmetro é positivo.

Pontos/Média Público
y = 0.0012x + 33.309
80 R² = 0.4435
70
60
50 Y (nºde pontos)
40
30 Linear (Y (nºde
pontos))
20
10
0
0 10000 20000 30000 40000

A variável se mostrou pertinente na composição do modelo, dado que seu R²


é igual a 0,4435. Através da equação de regressão, podemos inferir que, supondo
que todos os jogos não tivessem espectadores no estádio, o desempenho médio
esperado de um time seria de 33,309 pontos, e cada espectador a mais resultaria
num ganho de 0,0012 pontos, ou seja, a cada mil espectadores espera-se um ganho
médio de aproximadamente 1 ponto.

6
Box Plot e Histograma

Considera-se apenas os jogos da equipe como mandante


30,000 A distribuição dos dados apresenta
baixa assimetria à direita
25,000
(0,474029) e mediana (14.427)

20,000 bastante próxima da média


(15.010,75). A curtose próxima de 3
15,000
(mesocúrtica), Jarque-Bera igual a

10,000 0,791236 e probabilidade JB igual a


0,673264 evidenciam uma
5,000
distribuição normal. Há um outlier

0 próximo de 30.000 pagantes

6
Series: CONSIDERA_SE_APENAS_OS_J
Sample 1 20
5
Observations 20

4 Mean 15010.75
Median 14427.00
3 Maximum 29328.00
Minimum 4756.000
Std. Dev. 5832.772
2 Skewness 0.474029
Kurtosis 3.225102
1
Jarque-Bera 0.791236
Probability 0.673264
0
5000 10000 15000 20000 25000 30000

Justamente, o outlier superior é representado pela torcida do Corinthians,


conhecida por comparecer aos estádios, independente do desempenho do time,
enquanto os outliers inferiores correspondem às torcidas do América - MG e Avaí,
torcidas menores, que não costumam acompanhar o clube em outros estados,
exceto seu estado de origem.

7
- Folha de Pagamento:

Regressão

Essa variável mede o quanto cada clube gastou no ano com o elenco do time
e a comissão técnica. É esperado que quanto maior o gasto nesse setor, de maior
qualidade será o time, e melhor será o desempenho no decorrer do campeonato.
Pelo gráfico notamos que essa variável tem relação positiva com a variável resposta
e, de acordo com o modelo, ela explica cerca de 40,18% do desempenho no
campeonato (R²= 0,40179). Assim como esperado o estimador do parâmetro
apresenta sinal positivo.
Através da análise da equação de regressão da variável “folha de
pagamento”, é inconclusivo analisar o intercepto, uma vez que não faria sentido
pensar numa folha de pagamento nula, pois nesse caso, o time não existiria. Para a
análise do coeficiente de inclinação, a cada R$1,00 a mais investido, o desempenho
médio esperado do time seria de 0,0000002 pontos.

Pontos/Folha de pagamento
80
y = 2E-07x + 40.463
70 R² = 0.4018
60
50
40 Y (nºde pontos)

30 Linear (Y (nºde pontos))

20
10
0
R$ - R$ 50,000,000.00 R$ 100,000,000.00 R$ 150,000,000.00

8
Box Plot e Histograma

Folha de Pagamento
Desempenho Passado
Os dados apresentam uma ligeira
72
assimetria à direita (0,575935) que traz a
68
mediana para um valor mais baixo (49,5) que a
64
média (53,15). A menor distância entre ponto de
60 mínimo e segundo quartil com relação à distância
56 entre ponto de máximo e segundo quartil mostra
52 que o desvio padrão para os times com pior
48 rendimento de pontos no passado é menor que
44 para os times que ficaram acima na tabela.

40 Valores de Jarque-Bera e probabilidade JB


evidenciam uma distribuição não-normal. Os
clubes que apresentaram as maiores folha de
pagamento foram São Paulo e Corinthians
(quase R$100 milhões ao ano, cada), enquanto
Ceará e América-MG possuem as folhas mais
baratas (menos de R$10 milhões ao ano, cada).
5
Series: FOLHA_DE_PAGAMENTOS
Sample 1 20
4 Observations 20

Mean 47608000
3 Median 46950000
Maximum 99800000
Minimum 4560000.
2
Std. Dev. 31910846
Skewness 0.160347
Kurtosis 1.812467
1

Jarque-Bera 1.260899
0 Probability 0.532352
100.000 2.0e+07 4.0e+07 6.0e+07 8.0e+07 1.0e+08

9
- Desempenho Passado:

Regressão

Apesar de se esperar que a variável “desempenho passado” tenha alta


correlação com o desempenho futuro, os testes apresentaram um R² baixo, ou seja,
não é uma variável com grande importância na regressão. O que explicaria esse
contraste pode ser o fato de que dificilmente uma equipe se mantém intacta por mais
de uma temporada, sofrendo perda de jogadores e reformulação de estratégias.
Em relação a regressão “y = 0,4024 + 30,365” concluímos que B1= 30,365, o
que não faz sentido, já que supostamente ele indicaria o número de pontos que um
time faria quando esse não teve nenhum desempenho passado, o que é impossível
na serie A. Em relação ao B2 = 0,4024 entende-se que cada ponto feito no
campeonato passado reflete em 0,4024 pontos que serão feitos nesse campeonato.

Pontos/Desempenho Passado
80 y = 0.4024x + 30.365
R² = 0.1225
70
60 Y (nºde pontos)
50
40 Linear (Y (nºde
30 pontos))

20 Linear (Y (nºde
pontos))
10
0
0 20 40 60 80

Vale lembrar que todo ano quatro times sobem da serie B para a série A,
dificultando a apuração do desempenho passado, já que o número de pontos em
diferentes campeonatos não é equivalente. Para calcular o desempenho passado
desses times criamos um coeficiente que quando multiplicado com o número de
pontos feitos na serie B, seria equivalente ao número de pontos que esse time teria
feito caso fosse da serie A, esse coeficiente foi nomeado como coeficiente de
ascensão.
Para calcular o coeficiente de ascensão pegamos os números de pontos
feitos pelos quatro times que subiram de categoria desde 2008 e comparamos com
o número de pontos feitos nos anos seguintes pelos mesmos times.
10
Time 2008 2009 Ca
Corinthians 85 52 0,61
sntAndré 68 41 0,60
Avaí 67 57 0,85
Grêmio-SP 63 49 0,78
0,71

Time 2010 2011 Ca


Coritiba 71 57 0,80
Figueirense 67 58 0,87
Bahia 65 46 0,71
America –MG 63 37 0,59
0,74
Time 2009 2010 Ca
Vasco 76 49 0,64
Ceará 70 47 0,67
Guarani 69 37 0,54
Atlético GO 65 42 0,65
0,62

11
Box Plot e Histograma

Desempenho Passado
72
Os dados apresentam uma ligeira assimetria à direita
68
(0,575935) que traz a mediana para um valor mais
64
baixo (49,5) que a média (53,15). A menor distância
60 entre ponto de mínimo e segundo quartil com relação
56 à distância entre ponto de máximo e segundo quartil
mostra que o desvio padrão para os times com pior
52
rendimento de pontos no passado é menor que para
48
os times que ficaram acima na tabela. A curtose
44 menor que 3 (2,023503) mostra um maior
40 achatamento da função que representa os dados em
comparação e uma normal (platicúrtica).Valores de
Jarque-Bera e probabilidade JB evidenciam uma
distribuição não-normal. Não há outliers. O
Fluminense ocupa o topo do ranking com 71 pontos
no campeonato passado, enquanto o Avaí está na
“lanterna” com apenas 42.

7
Series: DESEMPENHO_PASSADO
6 Sample 1 20
Observations 20
5
Mean 53.15000
4 Median 49.50000
Maximum 71.00000
3 Minimum 42.00000
Std. Dev. 9.359909
2 Skewness 0.575935
Kurtosis 2.023503
1
Jarque-Bera 1.900292
Probability 0.386685
0
40 45 50 55 60 65 70 75

12
- Participação em campeonatos internacionais (dummy):

Regressão

Podemos ver a relação entre participação em campeonatos internacionais


(Copa Libertadores ou Copa Sul-americana) e pontos. A variável dummy foi
estabelecida como 1 aos times que participam de campeonatos internacionais e 0
caso contrário. Equipes que disputam esses campeonatos geralmente são de alto
nível, no entanto, é de se esperar que uma equipe que jogue tais competições,
simultaneamente ao campeonato brasileiro, tenha uma queda de rendimento, dado o
esforço em ambas competições.
Quando fizemos a análise dos dados, no entanto, verificamos que os clubes
participantes de campeonatos internacionais superam as dificuldades e contrariam
nossa expectativa inicial.

Participação em Camp. Int.


80
70
60
50
40 Participação em Camp.
Int.
30
20
10
0
0 0.5 1 1.5

13
Box Plot e Histograma

A distribuição dos dados para D=1 tem uma


pequenaassimetria à esquerda (-0,067043) que traz a
mediana (57,5) para um valor maior que a média (56,5). A
curtose abaixo de 3 (1,956629) mostra que a distribuição
dos dados é mais achatada que uma normal(platicúrtica).
Valores de Jarque-Bera (0,553301) e probabilidade JB
(0,758319) evidenciam a normalidade da função que
representa os dados. Não há outliers.
Para D=0, há uma assimetria à direita (0,200365),
trazendo a mediana (43,5) a um nível inferior ao da média
(44,625). O valor de curtose nos mostra uma distribuição
mais achatada que uma normal (platicúrtica). Ainda,
estatística de Jarque-Bera (0,468969) e probabilidade JB
(0,790978) evidenciam a normalidade da função.
Também não há outliers.

14
- Número de técnicos

Regressão

Outra variável explicativa que foi considerada relevante foi o “número de


técnicos”. Essa variável mensura a quantidade de técnicos que trabalharam na
equipe durante o campeonato. Normalmente, a troca de técnicos se da pela falta de
resultados positivos, ou seja, poucos pontos conquistados. Uma equipe que não
trocou de técnico provavelmente não passou por um momento de crise, tendo assim
pontuado mais pontos ao decorrer da competição. Logo, um menor número de
técnicos deve vir com um maior número de pontos. Pela análise do gráfico de
dispersão podemos observar um coeficiente de inclinação negativo, assim como
esperado.
De acordo com a equação de regressão, o modelo explica cerca de 56,77%
do desempenho de um time no campeonato (R²=0,56772). Interpretando o
coeficiente angular, vemos que para uma mudança de técnico comandandoa equipe
durante o campeonato acarreta uma diminuição média esperada de 7,7208 pontos
de tal time no campeonato. Não é possível analisar o intercepto já que não existe
time jogando sem a presença de técnico.

Pontos/Nº Tecnicos
y = -7.7208x + 67.578
80 R² = 0.5677

70

60

50

40 Y (nºde pontos)
Linear (Y (nºde pontos))
30

20

10

0
0 1 2 3 4 5

15
Box Plot e Histograma

Nº tecnicos
4.5 A distribuição dos dados apresenta uma leve assimetria à

4.0 direita (0,459616) e mediana (2) bastante próxima da média


(2,05). 75% dos times trocaram de técnico de uma a três
3.5
vezes durante o campeonato. O valor da curtose igual a
3.0
1,946429 mostra uma distribuição mais achatada que uma
2.5
normal (platicúrtica). Além disso, os números de Jarque-Bera
2.0 (1,629168) e probabilidade de JB (0,442824) resultam na
1.5 rejeição da hipótese de normalidade, ou seja, os dados são
representados por uma função não-normal. Não há outliers.
1.0

0.5

9
Series: N___TECNICOS
8 Sample 1 20
Observations 20
7

6 Mean 2.050000
Median 2.000000
5 Maximum 4.000000
Minimum 1.000000
4 Std. Dev. 1.050063
Skewness 0.459616
3
Kurtosis 1.946429
2
Jarque-Bera 1.629168
1 Probability 0.442824

0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5

16
-Interação entre participação em campeonatos internacionais e desempenho
passado:

Regressão

Por último, incluímos a variável de interação entre “desempenho passado” e


“participação em campeonatos internacionais”.Ela tem como objetivo mensurar o
impacto de um ponto a mais no desempenho passado nos pontos do campeonato
atual, dado que essa equipe está participando de campeonatos internacionais
Analisando a equação de regressão, o modelo explica cerca de 30,19% do
desempenho de um time no campeonato (R²=0,30191). Pelo coeficiente angular
esperamos que a cada ponto no desempenho passado, a equipe some em média
1,5123 pontos, uma vez que ela participa de um campeonato internacional.

Pontos/Interação Des.Pas. e
Part.Camp.Inter.
80
70 y = 1.5123x - 43.913
R² = 0.3019
60
50
40 Y(N de Pontos)
30 Linear (Y(N de Pontos))
20
10
0
0 20 40 60 80

17
- Correlações

Correlação publico/pontos
0,665976635
Correlação tecnico/pontos
-0,753469388
Correlação pagamento/pontos
0,644079965
Correlação desp.passado/pontos
0,35000773
Correlação participação camp.inter./pontos
0,554712016
Correlação Des.pas. e partic.
camp.inter./pontos
0,549460791

Vemos pela tabela que cinco variáveis apresentam correlação moderada


positiva (desempenho passado, público presente, desempenho passado,
participação em campeonatos internacionais e a interação). A única que apresenta
correlação forte negativa é a variável número de técnicos.
É possível ver que os sinais encontrados pela tabela de correlação são os
esperados. Pode-se observar que a correlação encontrada é a raiz do R² encontrado
no modelo de regressão.

18
Modelo

Para estimar o modelo desejado formulamos um modelo inicial a ser lapidado


ao decorrer do estudo.

Modelo inicial:

Ypontos=β1+β2*pagamentos+β3*desempenho_passado+β4*técnicos+β5*publi
co+β6*campinter+β7*desempenho_passado*campinter

A partir desse ponto foram aplicados os testes de heterocedasticidade, White


ajustado, correlação serial e Reset. Após verificar a validação do modelo conferimos
qual era a variável com o maior P. Valor, para que, em seguida voltamos a gerar
uma regressão com um novo modelo que excluísse tal variável. Essas etapas foram
repetidas até chegarmos em um modelo em que nenhuma variável fosse rejeitada
pelo teste T, com 20% de significância.

19
Ficamos então com o seguinte modelo:

Ypontos=β1+β2 *técnicos+β3*publico +β4*desempenho_passado*campinter

Para validar o modelo aplicamos os testes;

Heterocedasticidade

Ho: O modelo proposto é homocedástico (as variâncias dos erros são iguais).

Ha: O modelo proposto é heterocedástico (as variâncias dos erros são diferentes).

20
Conclusão

Com o modelo final em mãos podemos dizer que as únicas variáveis que afetam a
campanha do clube são público pagante, trocas de técnico e a interação entre
desempenho passado e participação em outros campeonatos, simultâneos ao
Brasileiro.

A variável “público pagante” apresentou coeficiente de 0,0008, aproximadamente, o


que significa que a cada mil pessoas a mais na média anual de público o clube
consiga mais um ponto, em média. A variável “Troca de técnico” apresentou
coeficiente de -5,23, nos indicando que a cada troca de técnico espera-se que o time
deixe de ganhar, em média, cinco pontos, aproximadamente.

Por último, a relação entre “desempenho passado” e “part. em campeonatos


internacionais” nos diz que caso o time esteja participando de algum outro
campeonato, simultâneo ao Brasileirão, espera-se que cada ponto conquistado na
edição passada do Brasileiro série A garanta, em média, 0,11 pontos ao clube.

Em posse desses resultados ficam claro quais são as variáveis que afetam
diretamente a campanha do clube, no Brasileiro série A, possibilitando a diretoria
dos times a elaboração de estratégias que maximizem o efeito dessas relações. No
caso, a diretoria pode desenvolver projetos que incentivem a ida dos torcedores aos
estádios, elevando a média anual de público, garantindo mais confiança para o
elenco e evidentemente, mais receita para os caixas do clube.

Ainda, os dirigentes terão de pensar duas vezes antes de demitir um técnico que
esteja em má fase, pois cada alteração tende a causar efeitos negativos na
campanha. De fato, isso é um problema enfrentado por todos os clubes brasileiros,
faz parte da cultura do futebol brasileiro demitir técnicos assim que o time apresente
queda de rendimento. São raros os casos de técnicos que consigam ficar mais de
três anos no mesmo clube, diferente do futebol Europeu, onde eles conseguem
administrar o time por diversas temporadas. Sem dúvida esse é um aspecto
importante nos desempenhos dos times e nosso estudo confirma sua relevância e
seu impacto nocivo ao clube.

21
Referências Bibliográficas

 BORTOLUZZO Adriana; IAROPOLI, Pedro; MACHADO, Sérgio. Demand for


Brazilian Soccer: A Censored Model Approach. Disponível em:
http://www.insper.edu.br/sites/default/files/2011_wpe237.pdf. Acesso em
9 de outubro de 2012;
 http://pt.wikipedia.org/wiki/Campeonato_Brasileiro_de_Futebol_de_2011_-
_S%C3%A9rie_A. Acesso em 15 de outubro de 2012;
 http://esporte.uol.com.br/futebol/campeonatos/brasileiro/2011/serie-
a/classificacao/classificacao.jhtm . Acesso em 15 de outubro de 2012;
 http://globoesporte.globo.com/futebol/brasileirao-serie-a/publico-
brasileirao.html. Acesso em 15 de outubro de 2012;
 http://pt.wikipedia.org/wiki/Campeonato_Brasileiro_de_Futebol_de_2010.
Acesso em 15 de outubro de 2012;
 http://opinioesemcampo.wordpress.com/2011/11/17/todas-trocas-de-tecnicos-
no-brasil-em-2011/. Acesso em 15 de outubro de 2012;
 http://pt.wikipedia.org/wiki/Anexo:Participa%C3%A7%C3%B5es_de_clubes_b
rasileiros_na_Libertadores_e_na_Sul-americana. Acesso em 15 de outubro
de 2012.

22

You might also like