Soluções das equações ciclotómicas como combinações racionais das operações elementares e extracção de raízes

No texto Permutações de raízes e resolução de equações do segundo, terceiro e quarto graus, foi apresentado um método geral que permite proporcionar a solução das equações de grau inferior ao quinto com base na composição das operações elementares e extracção de raízes. Pretende-se dar aqui uma demonstração simples de que é possível escrever as raízes de qualquer equação ciclotómica, isto é, qualquer equação da forma x^n-1=0, utilizando composições das operações elementares com extracção de raízes. O método aqui utilizado segue de perto as considerações tecidas no texto A permutação das raízes nas equações polinomiais.

Se n for um número composto então existe um número primo p tal que n=pn_1. A solução da equação x^n-1=0 é também solução do sistema de equações

\left\lbrace\begin{array}{l}y^{n_1}-1=0\\ x^p-y=0\end{array}\right.

Conhecidas as soluções y_i da equação y^{n_1}-1=0 e as soluções x_j da equação x^p-1=0, obtêm-se as soluções da equação geral na forma

\alpha_{ij}=\sqrt[p]{y_i}x_j

Se n_1 for um número composto, então n_1=qn_2 para algum primo q e as soluções y_i da equação x^{n_1}-1 são da forma

y_i=\sqrt[p]{z_j}w_k

onde z_j é raíz da equação x^{n_2}-1 e w_k é raiz da equação x^q-1=0. A aplicação recursiva do procedimento apresentado permite concluir que as soluções das equações x^n-1=0 se escrevem como combinação racional das operações elementares e extracção de raízes das equações x^p-1=0 onde p é um número primo que divide n. Resta, portanto, mostrar que as soluções da equação x^p-1=0 se podem escrever como combinação racional das operações elementares e da extracção de raízes.

Será aqui utilizado o método da indução na demonstração do resultado. No entanto, antes de expor o argumento indutivo é útil tecer algumas considerações sobre as soluções x_k da equação x^p-1=0 na sua forma trigonométrica. Se se considerar que x=e^{i\theta}, onde i representa a unidade imaginária, então a equação x^n=1 é escrita como

e^{ip\theta}=e^{2k\pi}

de onde se seguem as soluções x_k=e^{i\frac{2k\pi}{p}}, com k a variar desde 0 até p-1. É claro que x_0=1 é solução da equação x^p-1=0 qualquer que seja o valor de p. Interessa, portanto, mostrar que as raízes x_1,\cdots,x_{p-1} da equação

x^{p-1}+x^{p-2}+\cdots+x+1=0

se podem escrever como combinação racional das operações elementares e extracção de raízes. Da forma obtida para as raízes é fácil obter a identidade algébrica x_jx_k=x_{j+k} onde j+k é calculado módulo p. Daqui resulta que, x_k=x_1^k e x_kx_{p-k}=x_0=1.

O resultado vale para p=2. Com efeito, as soluções da equação x^2-1=0 são x_0=1 e x_1=-1 que se escrevem como combinação racional das operações elementares. Suponha-se que o resultado vale para todos os números primos inferiores a um número primo dado p. O resultado vale, portanto, para todos os valores de n inferiores a p e é válido, em particular, para n=p-1. Seja \alpha\ne 1 a raiz da equação x^p-1=0 tal que todas as outras raízes se podem escrever como \alpha^k para algum k. Do mesmo modo, considera-se \beta\ne1 raiz da equação x^{p-1}-1=0 de modo que todas as outras raízes se possam escrever como \beta^l para algum l. Seja \pi uma raiz primitiva módulo p. Definem-se as funções

L_k(\alpha)=\left(\sum_{i=0}^{p-2}{\beta^{ki}\alpha^{\pi^i}}\right)^{p-1}

com k=0,\cdots,p-2. Tem-se também, qualquer que seja j,

L_k\left(\alpha{\pi^j}\right)=\left(\sum_{i=0}^{p-2}{\beta^{ki}\alpha^{\pi^{i+j}}}\right)^{p-1}=\left(\beta^{-kj}\sum_{i=0}^{p-2}{\beta^{k(i+j)}\alpha^{\pi^{i+j}}}\right)^{p-1}=L_k(\alpha)

Assim,

L_k(\alpha)=\frac{1}{p-1}\sum_{i=0}^{p-2}{L\left(\alpha^{\pi^i}\right)}=\frac{1}{p-1}\sum_{i=1}^{p-1}{L\left(\alpha^i\right)}

é uma função simétrica das raízes da equação ciclotómica diferentes da unidade e, portanto, pode ser escrita como combinação racional dos seus coeficientes e das raízes da equação x^{p-1}-1=0 que, por hipótese, se escreve como combinação racional das operações elementares e da extracção de raízes. Então L_k(\alpha) também se escreve como combinação racional das operações elementares e extracção de raízes.

Das considerações anteriores segue o sistema de p-1 equações nas p-1 raízes \alpha^i da forma

\sum_{i=0}^{p-2}{\beta^{ki}\alpha^{\pi^i}}=\beta^{r_k}\sqrt[p-1]{L_k}

onde \beta^{r_k} é alguma raiz da equação x^{p-1}-1=0. Por exemplo, r_0=\frac{p-1}{2} já que L_0(\alpha)=-1 é igual à soma das raízes da equação x^p-1=0 diferentes da unidade. A solução do sistema proporciona as raízes da equação pretendida na forma

\alpha^{\pi^i}=\frac{1}{p-1}\sum_{k=0}^{p-2}{\beta^{-ki+r_k}\sqrt[p-1]{L_k}}

as quais se escrevem claramente como combinação racional das operações elementares e extracção de raízes. A prova do resultado fica deste modo completa.

O método de prova apresentado possui um carácter construtivo e pode ser aplicado à resolução de equações ciclotómicas. Seja, por exemplo, x^5-1=0 a equação da qual se considera \alpha\ne1 a raiz da unidade tal que todas as outras se escrevem na forma \alpha^k. Seja \beta\ne1 a raiz de x^4-1=0 de modo que qualquer outra raiz se escreva na forma \beta^k. Sabe-se que \beta=i. Atendendo a que 2 é raiz primitiva módulo 5, tem-se 2^0=1, 2^1=2, 2^2=4 e 2^3=3 módulo 5. Definem-se as funções

\beta^{r_k}\sqrt[4]{L_k(\alpha)}=\alpha+\beta^{k}\alpha^2+\beta^{2k}\alpha^4+\beta^{3k}\alpha^3

Dado que \beta=i e r_0=2 uma vez que i^2=-1, um pouco de álgebra permite determinar

\left\lbrace\begin{array}{l}\alpha+\alpha^2+\alpha^4+\alpha^3=-1\\ \alpha+i\alpha^2-\alpha^4-i\alpha^3=i^{r_1}\sqrt[4]{-15+20i}\\ \alpha-\alpha^2+\alpha^4-\alpha^3=i^{r_2}\sqrt{5}\\ \alpha-i\alpha^2-\alpha^4+i\alpha^3=i^{r_3}\sqrt[4]{-15-20i}\end{array}\right.

Não é garantido na prova do resultado anterior que todos os r_k conduzem às raízes da equação ciclotómica mesmo que estas se encontrem permutadas entre si. É necessário, após estabelecer uma combinação de valores para os r_k, substituir as soluções encontradas na equação original de modo a verificar se estas a satisfazem. No presente caso considera-se, por exemplo, r_1=r_2=r_3=0. O sistema fica da forma

\left\lbrace\begin{array}{l}\alpha_1+\alpha_2+\alpha_4+\alpha_3=-1\\ \alpha_1+i\alpha_2-\alpha_4-i\alpha_3=\sqrt[4]{-15+20i}\\ \alpha_1-\alpha_2+\alpha_4-\alpha_3=\sqrt{5}\\ \alpha_1-i\alpha_2-\alpha_4+i\alpha_3=\sqrt[4]{-15-20i}\end{array}\right.

Os índices em subscrito permitem assinalar o facto de que as soluções obtidas poderão não ser dadas pelas potências de uma solução individual. As soluções do sistema escrevem-se na forma

\left\lbrace\begin{array}{l}\alpha_1=\frac{-1+\sqrt[4]{-15+20i}+\sqrt{5}+\sqrt[4]{-15-20i}}{4}\\ \alpha_2=\frac{-1-i\sqrt[4]{-15+20i}-\sqrt{5}+i\sqrt[4]{-15-20i}}{4}\\ \alpha_3=\frac{-1+i\sqrt[4]{-15+20i}-\sqrt{5}-i\sqrt[4]{-15-20i}}{4}\\ \alpha_4=\frac{-1-\sqrt[4]{-15+20i}+\sqrt{5}-\sqrt[4]{-15-20i}}{4}\end{array}\right.

Convém estabelecer uma expressão mais simples para as soluções encontradas. Como

\begin{array}{l}\left(\sqrt[4]{-15+20i}+\sqrt[4]{-15-20i}\right)^2=\sqrt{-15+20i}+\sqrt{-15-20i}+10\\ \left(\sqrt[4]{-15+20i}-\sqrt[4]{-15-20i}\right)^2=\sqrt{-15+20i}+\sqrt{-15-20i}-10\\ \left(\sqrt{-15+20i}+\sqrt{-15-20i}\right)^2=20\end{array}

então

\begin{array}{l}\sqrt[4]{-15+20i}+\sqrt[4]{-15-20i}=\sqrt{10+2\sqrt{5}}\\ \sqrt[4]{-15+20i}-\sqrt[4]{-15-20i}=i\sqrt{10-2\sqrt{5}}\end{array}

As soluções encontradas podem ser escritas na forma

\left\lbrace\begin{array}{l}\alpha_1=\frac{-1+\sqrt{5}+\sqrt{10+2\sqrt{5}}}{4}\\ \alpha_2=\frac{-1-\sqrt{5}+\sqrt{10-2\sqrt{5}}}{4}\\ \alpha_3=\frac{-1-\sqrt{5}-\sqrt{10-2\sqrt{5}}}{4}\\ \alpha_4=\frac{-1+\sqrt{5}-\sqrt{10+2\sqrt{5}}}{4}\end{array}\right.

É claro que não satisfazem a equação x^5-1=0 uma vez que se tratam de números reais. Além disso, tem-se

\alpha_1^2=1+\frac{\sqrt{10-\sqrt{5}}}{5}=1+\frac{\alpha_2+\alpha_3}{2i}

O quadrado de \alpha_1 é diferente de \alpha_2 como seria de esperar a partir da estrutura das raízes de x^5-1=0. De um modo geral, valem as identidades

\left\lbrace\begin{array}{l}\alpha_1^2=1+\frac{\alpha_2-\alpha_3}{2i}\\ \alpha_2^2=1+\frac{\alpha_4-\alpha_1}{2i}\\ \alpha_3^2=1+\frac{\alpha_1-\alpha_4}{2i}\\ \alpha_4^2=1+\frac{\alpha_3-\alpha_2}{2i}\end{array}\right.

Não é difícil de concluir ainda que as soluções encontradas satisfazem a equação polinomial

x^4+x^3-\frac{5}{2}x^2+\frac{3}{2}x-1=0

As soluções da equação x^5-1=0 diferentes da unidade obtêm-se do sistema, considerando r_2=0 e r_1=r_3=1. Neste caso fica

\left\lbrace\begin{array}{l}\alpha_1=\frac{-1+\sqrt{5}+i\sqrt{10+2\sqrt{5}}}{4}\\ \alpha_2=\frac{-1-\sqrt{5}+i\sqrt{10-2\sqrt{5}}}{4}\\ \alpha_3=\frac{-1-\sqrt{5}-i\sqrt{10-2\sqrt{5}}}{4}\\ \alpha_4=\frac{-1+\sqrt{5}-i\sqrt{10+2\sqrt{5}}}{4}\end{array}\right.

De facto, não é difícil de verificar que \alpha_1^2=\alpha_2, \alpha_2^2=\alpha_4 e \alpha_4^2=\alpha_3 como seria de esperar. As soluções assim obtidas são resultado da combinação racional das operações elementares e da extracção de raízes.

Anúncios
Publicado em Matemática | Etiquetas , , , | Publicar um comentário

Permutações de raízes e resolução de equações de segundo, terceiro e quarto graus

Sabe-se que não é possível resolver equações cujo grau é superior ao quarto. Trata-se de um resultado que advém da observação de que, a uma determinada equação, está associado um grupo de permutações G com a propriedade de que qualquer função das raízes invariante mediante a aplicação de permutações de G e que varia mediante a aplicação de permutações que não se encontram em G se pode escrever como combinação racional dos coeficientes da equação original. O conceito em si apresenta-se de um modo algo abstracto. No entanto, a resolução das equações de graus inferiores ao quinto, recorrendo a ideias sobre permutações de raízes, permite tornar o tópico um pouco mais claro.

Seja uma equação genérica da forma

x^n+a_{n-1}x^{n-1}+\cdots+a_0=0

Sabe-se que a equação possui n raízes que são aqui denotadas por x_1,\cdots,x_n. O algoritmo da divisão permite escrever

(x-x_1)(x-x_2)\cdots(x-x_n)=0

A expansão do produto anterior e a sua comparação com os coeficientes da equação original conduz à expressão

a_{n-k}=(-1)^k\sum_{i_1<i_2<\cdots<i_k}{\prod_{j=1}^k{x_{i_j}}}

Tratam-se de funções simétricas das raízes, isto é, funções das raízes que são invariantes mediante a aplicação de qualquer permutação.

Seja a equação do segundo grau da forma

x^2+ax+b=0

Se x_1 e x_2 forem as suas raízes então

\left\lbrace\begin{array}{l} a=-\left(x_1+x_2\right)\\ b=x_1x_2 \end{array}\right.

O grupo S_2 das permutações de duas raízes possui apenas dois elementos, nomeadamente, a identidade (1)(2) e a transposição (1,2). Constrói-se a função

\varphi_1\left(x_1,x_2\right)=px_1+qx_2

A permutação idêntica (1)(2) não altera a função. No entanto, a permutação (1,2), que troca a raiz x_1 com x_2, transforma-a em

\varphi_2\left(x_1,x_2\right)=qx_1+px_2

Tanto a permutação identidade como a transposição não alteram cada uma das expressões \varphi_1\left(x_1,x_2\right)+\varphi_2\left(x_1,x_2\right) e \varphi_1\left(x_1,x_2\right)\varphi_2\left(x_1,x_2\right). Deste modo, os coeficientes da equação

\left(x-\varphi_1\left(x_1,x_2\right)\right)\left(x-\varphi_2\left(x_1,x_2\right)\right)=0

podem ser escritos como combinação racional dos coeficientes da equação original e das quantidades p e q. O resultado é garantido pelo algoritmo lexicográfico. De facto, a substituição das funções pelas suas expressões e a respectiva expansão conduz à equação

x^2-(p+q)\left(x_1+x_2\right)x+\left(p^2+q^2\right)x_1x_2+pq\left(x_1^2+x_2^2\right)=0

Como valem as identidades

\left\lbrace\begin{array}{l} x_1+x_2=-a\\ x_1x_2=b\\ x_1^2+x_2^2=\left(x_1+x_2\right)^2-2x_1x_2=a^2-2b \end{array}\right.

então a equação anterior reduz-se a

x^2-(p+q)ax+\left(p^2+q^2\right)b+pq\left(a^2-2b\right)=0

Os valores de p e p podem ser escolhidos arbitrariamente. Se se fizer p=1 e q=-1 obtém-se a equação

x^2-\left(a^2-4b\right)=0

Segue-se daqui que, sendo \varphi_1\left(x_1,x_2\right) e \varphi_2\left(x_1,x_2\right) soluções da equação anterior então

\left\lbrace\begin{array}{l} \varphi_1\left(x_1,x_2\right)=\sqrt{a^2-4b}\\ \varphi_2\left(x_1,x_2\right)=-\sqrt{a^2-4b} \end{array}\right.

isto é, x_1-x_2=\sqrt{a^2-4b} que, combinada com a equação x_1+x_2=-a conduz às soluções

\left\lbrace\begin{array}{l} x_1=\frac{-a+\sqrt{a^2-4b}}{2}\\ x_2=\frac{-a-\sqrt{a^2-4b}}{2} \end{array}\right.

Se se considerasse \varphi_1\left(x_1,x_2\right)=-\sqrt{a^2-b} e \varphi_2\left(x_1,x_2\right)=\sqrt{a^2-b} obter-se-iam as mesmas raízes dispostas na ordem inversa.

A obtenção das raízes da equação a partir dos valores das funções \varphi_1 e \varphi_2 por intermédio da solução de um sistema parece um pouco artificial. Um outro método para a determinação dos seus valores passa por observar que os coeficientes do monómio x-\varphi_1 podem ser escritos como combinação racional da raiz x_1 e dos coeficientes do polinómio

\frac{x^2+ax+b}{x-x_1}=x+a+x_1

Porém, dado que o resultado do quociente é dado pelo monómio x-x_2, segue-se que a+x_1=-x_2. Por outro lado, substituindo x_2 e \varphi_1 pelos seus valores no monómio

\varphi_1-\left(x_1-x_2\right)

obtém-se

\sqrt{a^2-4b}-2x_1-a

Sabe-se, da definição de \varphi, que x_1 é simultaneamente um zero do binómio \sqrt{a^2-4b}-2x-a e do polinómio orignal x^2+ax+b. O máximo divisor comum permite determinar que a solução é, de facto, da forma

x_1=\frac{-a+\sqrt{a^2-4b}}{2}

Procede-se do mesmo modo, considerando \varphi_2, obtendo-se

\frac{-a-\sqrt{a^2-4b}}{2}

O segundo procedimento para a obtenção dos valores das raízes a partir das variáveis \varphi poder-se-á afigurar ter uma complexidade exagerada. No entanto, continua a ser válido para equações de graus superiores e para valores arbitrários dos coeficientes das raízes considerados nas funções \varphi.

Seja agora a equação do teceiro grau

x^3+ax^2+bx+c=0

da qual se supõe serem x_1, x_2 e x_3 as suas raízes. Considera-se agora a função

\varphi\left(x_1,x_2,x_3\right)=ux_1+vx_2+wx_3

Sabe-se que o grupo simétrico S_3 das permutações de três objectos é constituído pelos elementos

\begin{array}{ccc} (1)(2)(3), & (1,2,3), & (3,1,2)\\ (1,2)(3), & (1)(2,3), & (2)(1,3) \end{array}

A aplicação de cada uma das permutações das raízes p\in S_3 à função \varphi origina seis funções \varphi_p. Por exemplo,

\varphi_{(1)(2,3)}=ux_1+wx_2+vx_3

Constrói-se a equação de sexto grau

\prod_{p\in S_3}\left(x-\varphi_p\right)=0

Se q for uma permutação que, aplicada a \varphi a transforma em \varphi_q e p for aplicada a \varphi_q obtém-se a função que se obteria de \varphi, aplicando a permutação dada pelo produto pq. Como as permutações p transformam os \varphi_q uns nos outros, então uma função simétrica dos \varphi_q é também função simétrica das raízes e, de acordo com o algoritmo lexicográfico, pode ser escrita como combinação racional dos coeficientes da equação original, isto é, de a, b e c. Uma vez que a permutação das raízes em \varphi é equivalente à permutação dos parâmetros u, v e w, os coeficientes da equação

\prod_{p\in S_3}\left(x-\varphi_p\right)=0

podem ser escritos como combinação racional dos coeficientes a, b e c da equação original e das funções simétricas de u, v e w. Por exemplo, o coeficiente em x^5 é dado por

\sum_{p\in S_3}\varphi_p=2(u+v+w)\left(x_1+x_2+x_3\right)=-2(u+v+w)a

O cálculo dos restantes coeficientes da equação, apesar de se mostrar um exercício interessante, é desprovido de interesse nesta fase. Considere-se agora a função racional

\delta\left(x_1,x_2,x_3\right)=\left(x_1-x_2\right)\left(x_1-x_3\right)\left(x_2-x_3\right)

Trata-se de uma função que assume apenas dois valores aquando da aplicação de todas as permutações, nomeadamente,

\left\lbrace\begin{array}{l} \delta_{\left\lbrack (1)(2)(3)\right\rbrack}\left(x_1,x_2,x_3\right)=\left(x_1-x_2\right)\left(x_1-x_3\right)\left(x_2-x_3\right)\\ \delta_{\left\lbrack (1,2)(3)\right\rbrack}\left(x_1,x_2,x_3\right)=-\left(x_1-x_2\right)\left(x_1-x_3\right)\left(x_2-x_3\right) \end{array}\right.

Qualquer função simétrica em \delta_{\left\lbrack (1)(2)(3)\right\rbrack} e \delta_{\left\lbrack (1,2)(3)\right\rbrack} pode ser representada como combinação racional dos coeficientes da equação original. Segue-se que estas quantidades são solução da equação quadrática

\left(x-\delta_{\left\lbrack (1)(2)(3)\right\rbrack}\right)\left(x-\delta_{\left\lbrack (1)(2,3)\right\rbrack}\right)=0

cujos coeficientes se escrevem como combinação racional dos da equação original. Com efeito, \delta_{\left\lbrack (1)(2)(3)\right\rbrack}+\delta_{\left\lbrack (1)(2,3)\right\rbrack}=0 e

\delta_{\left\lbrack (1)(2)(3)\right\rbrack}\delta_{\left\lbrack (1)(2,3)\right\rbrack}=-\left(a^2b^2-4b^3-4a^3c-27c^2+18abc\right)

Utilizando a abreviatura D=a^2b^2-4b^3-4a^3c-27c^2+18abc, a equação anterior pode ser escrita na forma

x^2-D=0

cuja solução se sabe ser \delta_{\left\lbrack (1)(2)(3)\right\rbrack}=\sqrt{D} e \delta_{\left\lbrack (1)(2,3)\right\rbrack}=-\sqrt{D} ou vice-versa. Considera-se aqui \delta=\sqrt{D}. Seja G o subgrupo de S_3 constituído pelas permutações

G=\left\lbrace (1)(2)(3),(1,2,3),(3,1,2)\right\rbrace

e G' o conjunto das restantes permutações de tal forma que S_3=G\cup G', isto é, G' é o único co-conjunto de G em S_3. Dado que \delta é invariante mediante as permutações de G, a sua adição ao conjunto dos racionais permite baixar o grupo da equação para G. Ora, a equação

\prod_{p\in S_3}\left(x-\varphi_p\right)=0

pode ser factorizada como

\prod_{p\in G}\left(x-\varphi_p\right)\prod_{q\in G'}\left(x-\varphi_q\right)=0

Uma vez que as funções simétricas nas variáveis \varphi_p quando p\in G são invariantes mediante as permutações de G, os coeficientes de cada um dos factores escrevem-se como combinação racional dos coeficientes da equação original e de \delta. Feitas as contas, o polinómio anterior fica da forma

\left(x^3+Ax^2+Bx+C+\kappa_1K_1+\kappa_2K_2\right)\left(x^3+Ax^2+Bx+C+\kappa_2K_1+\kappa_1K_2\right)

onde

\left\lbrace\begin{array}{l} A=(u+v+w)a\\ B=\left(u^2+v^2+w^2\right)b+(uv+uw+vw)\left(a^2-b\right)\\ C=\left(u^3+v^3+w^3+3uvw\right)c+uvw\left(a^3-3ab+3c\right)\\ K_1=x_1^2x_2+x_2^2x_3+x_3^2x_1\\ K_2=x_1^2x_3+x_2^2x_1+x_3^2x_2\\ \kappa_1=u^2v+v^2w+w^2u\\ \kappa_2=u^2w+v^2u+w^2v \end{array}\right.

As funções K_1 e K_2 são invariantes mediante a aplicação das permutações do grupo G, sendo possível escrevê-las como combinação racional dos coeficientes da equação original e de \delta. Para determinar essa combinação, observa-se que as expressões K_1+K_2 e K_1\delta-K_2\delta são funções simétricas nas raízes e, por conseguinte, podem escrever-se como combinações racionais dos coeficientes a, b e c. Tal é verdade já que as permutações de G\subset S_3 deixam K_1, K_2 e \delta invariantes e as de G' transformam K_1 em K_2 e \delta em -\delta e vice-versa. Fica, então

\left\lbrace\begin{array}{l} K_1+K_2=3c-ab\\ K_1\delta-K_2\delta=\delta^2 \end{array}\right.

isto é,

\left\lbrace\begin{array}{l} K_1=\frac{3c-ab+\delta}{2}\\ K_2=\frac{3c-ab-\delta}{2} \end{array}\right.

Se u, v e w forem raízes da unidade, isto é, forem soluções da equação

x^3-1=0

então u+v+w=0 e uv+uw+vw=0 de onde se segue que A=0 e B=0. A adição destes racionais permite reduzir a equação subsidiária a

\left(x^3-\frac{-2a^3+3ab-27c-3\delta}{2}\right)\left(x^3-\frac{-2a^3+3ab-27c+3\delta}{2}\right)=0

Se \alpha for uma raiz da unidade, e se fizer u=1, v=\alpha e w=\alpha^2, uma das raízes da equação anterior pode ser escolhida para valor da combinação x_1+\alpha x_2+\alpha^2x_3 e, portanto,

x_1+\alpha x_2+\alpha^2 x_3=\sqrt[3]{\frac{-2a^3+3ab-27c-3\delta}{2}}

Poder-se-ia observar que a outra raiz poderia ser atribuída à combinação x_1+\alpha^2 x_2+\alpha x_3 e que x_1+x_2+x_3=-a. O sistema das três equações poderia ser resolvido para determinar o valor das raízes. Um outro método será aqui seguido. Ora, a função

\lambda\left(x_1,x_2,x_3\right)=x_1+\alpha x_2+\alpha^2 x_3

admite dois valores quando se aplicam todas as permutações que fixam a raiz x_1, nomeadamente,

\left\lbrace\begin{array}{l} \lambda_1\left(x_1,x_2,x_3\right)=x_1+\alpha x_2+\alpha^2 x_3\\ \lambda_2\left(x_1,x_2,x_3\right)=x_1+\alpha^2 x_2+\alpha x_3 \end{array}\right.

Os coeficientes da equação

\left(x-\lambda_1\right)\left(x-\lambda_2\right)=0

são funções simétricas nas raízes x_2 e x_3 e, portanto, podem ser escritos como combinação racional de x_1 e dos coeficientes da equação

\frac{x^3+ax^2+bx+c}{x-x_1}=0

ou seja, da equação

x^2+\left(a+x_1\right)x+\left(b+ax_1+x_1^2\right)=0

Por seu turno,

\left\lbrace\begin{array}{l} \lambda_1+\lambda_2=2x_1-\left(x_2+x_3\right)\\ \lambda_1\lambda_2=\left(x_1+x_2+x_3\right)^2-3\left(x_1x_2+x_1x_3+x_2x_3\right) \end{array}\right.

ou

\left\lbrace\begin{array}{l} \lambda_1+\lambda_2=3x_1+a\\ \lambda_1\lambda_2=a^2-3b \end{array}\right.

Sabe-se, portanto, que \lambda_1=\sqrt[3]{\frac{-2a^3+3ab-27c-\delta}{2}} é solução da equação

x^2-\left(3x_1+a\right)x+a^2-3b=0

ou

\lambda_1^2-\left(3x_1+a\right)\lambda_1+a^2-3b=0

Segue-se que x_1 é simultaneamente solução da equação polinomial

3x\lambda_1-\lambda_1^2+a\lambda_1-a^2+3b=0

e da equação original x^3+ax^2+bx+c=0. O máximo divisor comum mónico entre ambos os polinómios é dado por

x-\frac{-a+\lambda_1+\frac{a^2-3b}{\lambda_1}}{3}

Note-se que x_1 é zero do máximo divisor comum. Como \lambda_1\lambda_2=a^2-3b então

x_1=\frac{-a+\lambda_1+\lambda_2}{3}

isto é,

x_1=\frac{-a+\sqrt[3]{\frac{-2a^3+3ab-27c-\delta}{2}}+\sqrt[3]{\frac{-2a^3+3ab-27c+\delta}{2}}}{3}

onde \delta=\sqrt{a^2b^2-4b^3-4a^3c-27c^2+18abc}. O mesmo método presta-se à determinação das restantes raízes. De facto, se se aplicarem as permutações que fixam x_2 à função \lambda, obtêm-se as funções

\left\lbrace\begin{array}{l} \lambda_1\left(x_1,x_2,x_3\right)=x_1+\alpha x_2+\alpha^2 x_3\\ \lambda_2\left(x_1,x_2,x_3\right)=\alpha^2 x_1+\alpha x_2+x_3 \end{array}\right.

Por seu turno, as permutações que fixam x_3 quando aplicadas a \lambda geram as funções

\left\lbrace\begin{array}{l} \lambda_1\left(x_1,x_2,x_3\right)=x_1+\alpha x_2+\alpha^2 x_3\\ \lambda_2\left(x_1,x_2,x_3\right)=\alpha^2 x_1+ \alpha x_2+x_3 \end{array}\right.

O mesmo procedimento permite concluir que x_2 satisfaz a equação

3x\alpha\lambda_1-\lambda_1^2+\alpha a\lambda_1-\alpha^2\left(a^2-3b\right)=0

e x_3 satisfaz a equação

3x\alpha^2\lambda_1-\lambda_1^2+\alpha^2 a\lambda_1-\alpha\left(a^2-3b\right)=0

Como cada uma das raízes satisfaz a equação original, os respectivos máximos divisores comuns permitem obter o seu valor. Tem-se, portanto,

\left\lbrace\begin{array}{l} x_1=\frac{-a+\sqrt[3]{\frac{-2a^3+3ab-27c-\delta}{2}}+\sqrt[3]{\frac{-2a^3+3ab-27c+\delta}{2}}}{3}\\ x_2=\frac{-a+\alpha^2\sqrt[3]{\frac{-2a^3+3ab-27c-\delta}{2}}+\alpha\sqrt[3]{\frac{-2a^3+3ab-27c+\delta}{2}}}{3}\\ x_3=\frac{-a+\alpha\sqrt[3]{\frac{-2a^3+3ab-27c-\delta}{2}}+\alpha^2\sqrt[3]{\frac{-2a^3+3ab-27c+\delta}{2}}}{3} \end{array}\right.

onde \delta=\sqrt{a^2b^2-4b^3-4a^3c-27c^2+18abc}. Note-se que tanto a troca de \delta por -\delta como de \lambda_1 por \lambda_2 não alteram o conjunto das raízes mas apenas a ordem em que aparecem.

Seja agora a equação do quarto grau da forma

x^4+ax^3+bx^2+cx+d=0

cujas raízes se supõe serem x_1, x_2, x_3 e x_4. Poder-se-ia aqui começar por considerar a função

\delta=\prod_{i<j}^4{\left(x_i-x_j\right)}

à semelhança do procedimento usado nas equações anteriores. A função é invariante mediante a aplicação das permutações do grupo alternado A_4 dado por todas as permutações que podem ser obtidas por um número par de transposições. A função assume dois valores, \delta e -\delta que são raízes da equação x^2-\delta^2=0 cujos coeficientes se podem escrever como combinações racionais dos coeficientes da equação original. Poder-se-ia, de seguida, considerar o subgrupo normal de A_4,

I=\left\lbrace(1)(2)(3)(4),(1,2)(3,4),(1,3)(2,4),(1,4)(2,3)\right\rbrace

A função \varphi=x_1x_2+x_3x_4 é invariante mediante a aplicação das transformações de I e varia com a aplicação das restantes permutações de A_4, assumindo três valores distintos que são solução de uma equação polinomial do terceiro grau cujos coeficientes se escrevem como combinação racional de \delta e dos coeficientes da equação original. A adição do irracional \varphi dado por uma das equações do terceiro grau permite reduzir o grupo da equação de A_4 para I. Dado que os cálculos envolvidos começam a complicar, é útil considerar métodos mais expeditos.

Pondo de lado o grupo alternado, a função \varphi=x_1x_2+x_3x_4 atrás considerada é invariante mediante as permutações do subgrupo de S_4,

G=\left\lbrace\right (1)(2)(3)(4),(1,2),(3,4),(1,2)(3,4),(1,3)(2,4),(1,4)(2,3)\rbrace

sendo claro que I\subset G. A função assume três valores distintos aquando da aplicação de todas as permutações de S_4, nomeadamente,

\left\lbrace\begin{array}{l} \varphi_1=x_1x_2+x_3x_4\\ \varphi_2=x_1x_3+x_2x_4\\ \varphi_3=x_1x_4+x_2x_3 \end{array}\right.

As funções \varphi_1, \varphi_2 e \varphi_3 são solução da equação polinomial

\left(x-\varphi_1\right)\left(x-\varphi_2\right)\left(x-\varphi_3\right)=0

que se calcula, em função dos coeficientes da equação original, como

x^3-bx^2+(ac-4d)x-\left(a^3-4b\right)d-c^2=0

A adição do irracional \varphi_1 permite reduzir o grupo da equação a G. Considere-se agora o subgrupo

H=\left\lbrace (1)(2)(3)(4),(1,2),(3,4)\right\rbrace

Seja a função \psi=x_1x_2, invariante mediante as permutações do grupo H. A função assume dois valores, nomeadamente,

\left\lbrace\begin{array}{l} \psi_1=x_1x_2\\ \psi_2=x_3x_4 \end{array}\right.

quando submetida às permutações do grupo G. Segue-se que são soluções da equação quadrática

\left(x-\psi_1\right)\left(x-\psi_2\right)=0

cujos coeficientes se escrevem como combinação racional de \varphi_1 e dos coeficientes da equação original. Com efeito, é fácil de calcular que \psi_1+\psi_2=\varphi_1 e \psi_1\psi_2=d. A equação anterior reduz-se a

x^2-\varphi_1x+d=0

A inclusão do irracional \psi_1 permite reduzir o grupo da equação a H. Como nenhuma das permutações de H permuta x_1 em \psi_1, os coeficientes da equação polinomial

x-\psi_1=0

podem ser escritos como combinação racional de \varphi_1, \psi_1, x_1 e dos coeficientes da equação original. De facto, sendo a função x_1+x_2 invariante mediante a aplicação das transformações de H, pode ser escrita como combinação racional de \varphi_1, \psi_1 e dos coeficientes da equação original. Ora,

\left\lbrace\begin{array}{l} \left(x_1+x_2\right)+\left(x_3+x_4\right)=-a\\ \psi_2\left(x_1+x_2\right)+\psi_1\left(x_3+x_4\right)=-c \end{array}\right.

A divisão de x^2-\varphi_1x+d por x-\psi_1 proporciona, como quociente, o monómio x+\psi_1-\varphi_1 que, evidentemente, possui \psi_2 como zero, isto é, \psi_2+\psi_1-\varphi_1=0. Substituindo \psi_2 no sistema e resolvendo para \psi_1 proporciona

x_1+x_2=\frac{c-a\psi_1}{\varphi_1}

isto é,

x_2=x_1-\frac{c-a\psi_1}{\varphi_1}

A equação x-\psi_1=0 reduz-se a

x-x_1\left(x_1-\frac{c-a\psi_1}{\varphi_1}\right)

da qual \psi_1 é solução. Então x_1 é simultaneamente solução da equação original e de

\psi_1-x\left(x-\frac{c-a\psi_1}{\varphi_1}\right)=0

O valor de x_1 determina-se, calculando o máximo divisor comum entre o polinómio anterior e x^4+ax^3+bx+c. Dada a complexidade do cálculo do máximo divisor comum, é útil encontrar um método alternativo.

Ora, segue-se da discussão anterior que \left(x-x_1\right)\left(x-x_2\right) é dado por

x^2-\frac{c-a\psi_1}{\varphi_1}+\psi_1

Resolvendo o sistema em ordem a x_3+x_4 e aplicando os mesmos cálculos, facilmente se verifica que \left(x-x_3\right)\left(x-x_4\right) se expande como

x^2-\frac{c-a\psi_2}{\varphi_1}+\psi_2

A equação original da forma x^4+ax^3+bx+c=0 admite, portanto, a factorização

\left\lbrack x^2-\frac{c-a\psi_1}{\varphi_1}+\psi_1\right\rbrack\left\lbrack x^2-\frac{c-a\left(\varphi_1-\psi_1\right)}{\varphi_1}+\varphi_1-\psi_1\right\rbrack=0

De um modo resumido, a equação genérica de quarto grau da forma

x^4+ax^3+bx^2+cx+d=0

resolve-se do seguinte modo. Começa-se por considerar a equação cúbica

x^3-bx^2+(ac-4d)x-\left(a^3-4b\right)d-c^2=0

da qual se obtém uma raíz z que é usada para construir a equação quadrática

x^2-zx+d=0

da qual se obtém uma raiz y. A equação original factoriza-se em

\left\lbrack x^2-\frac{c-ay}{z}+y\right\rbrack\left\lbrack x^2-\frac{c-a\left(z-y\right)}{z}+z-y\right\rbrack=0

As soluções apresentadas para a resolução das equações de segundo, terceiro e quarto graus parecem carecer da simplicidade inerente aos métodos mais directos. A abordagem aqui seguida tem a vantagem de obter as soluções depois de identificar a estrutura do grupo quando este é solúvel.

Publicado em Matemática | Etiquetas , , , | 1 Comentário

Um resultado notável sobre a soma dos divisores de um número

Seja n um número inteiro. Denota-se por \sigma(n) a soma de todos os divisores de n, isto é,

\sigma(n)=\sum_{d\vert n}{d}

Por exemplo, todos os números d que dividem n=18 são d=1, d=2, d=3, d=6, d=9 e d=18. Então,

\sigma(n)=1+2+3+6+9+18=39

Não é difícil concluir que se p for um número primo então \sigma(p)=p+1, uma vez que os seus divisores são d=1 e d=p. Por seu turno, os divisores de p^m são d=1, d=p, d=p^2, …, d=p^m e, portanto, \sigma\left(p^m\right) é dado pela soma da série geométrica

\sigma\left(p^m\right)=1+p+p^2+\cdots+p^m=\frac{p^{m+1}-1}{p-1}

Finalmente, se n se decompuser em factores primos da forma

n=p_1^{\alpha_1}p_2^{\alpha_2}\cdots p_m^{\alpha_m}

não é difícil verificar que

\sigma(n)=\left(1+p_1+p_1^2+\cdots+p_1^{\alpha_1}\right)\left(1+p_2+p_2^2+\cdots+p_2^{\alpha_2}\right)\cdots\left(1+p_m+p_m^2+\cdots+p_m^{\alpha_m}\right)

uma vez que cada parcela da expansão do produto proporciona a factorização de um divisor de n.

Considere-se agora a família de polinómios

\pi_n(t,x)=(1-tx)\left(1-tx^2\right)\left(1-tx^3\right)\cdots\left(1-tx^n\right)

onde se faz \pi_n=\pi_n(1,x), isto é,

\pi_n=(1-x)\left(1-x^2\right)\left(1-x^3\right)\cdots\left(1-x^n\right)

Algumas das expansões proporcionam

\begin{array}{l} \pi_1=1-x\\ \pi_2=1-x-x^2+x^3\\ \pi_3=1-x-x^2+x^4+x^5-x^6\\ \pi_4=1-x-x^2+2x^5-x^8-x^9+x^{10}\\ \pi_5=1-x-x^2+x^5+x^6+x^7-x^8-x^9-x^{10}+x^{13}+x^{14}-x^{15}\\ \vdots \end{array}

Uma forma de determinar os primeiros n coeficientes da expansão do produto para valores de n elevados pode passar pela consideração de logaritmos. Assim, se se fizer

\pi_n=1+a_1x+a_2x^2+\cdots+a_nx^n+\cdots

obtém-se

\log{\pi_n}=\log{\left(1-x\right)}+\log{\left(1-x^2\right)}+\cdots+\log{\left(1-x^n\right)}

Segue-se, por derivação, que

-\frac{x}{\pi_n}\frac{d\pi_n}{dx}=\frac{x}{1-x}+\frac{2x^2}{1-x^2}+\cdots+\frac{nx^n}{1-x^n}

Sabe-se, da expansão da série geométrica, que

\frac{x^m}{1-x^m}=x^m+x^{2m}+x^{3m}+\cdots

isto é, cada termo da série contém x elevado a uma potência que é múltipla de m. Ora, se k\le n, o coeficiente do termo em x^k é resultado da soma dos coeficientes da expansão oriunda das fracções

\frac{mx^m}{1-x^m}

desde que k seja múltiplo de m. Por outras palavras, o coeficiente em x^k é dado pela soma \sigma(k) dos seus divisores. Se k>n, o coeficiente é dado pela soma dos divisores de k não superiores a n. Deste modo,

-\frac{x}{\pi_n}\frac{d\pi_n}{dx}=\sigma(1)x+\sigma(2)x^2+\cdots+\sigma(n)x^n+\cdots

Por seu turno,

-\frac{x}{\pi_n}\frac{d\pi_n}{dx}=-\frac{a_1x+2a_2x^2+3a_3x^3+\cdots+na_nx^n+\cdots}{1+a_1x+a_2x^2+\cdots+a_nx^n+\cdots}

Daqui segue que o valor da expansão de

\left(\sigma(1)x+\sigma(2)x^2+\cdots+\sigma(n)x^n+\cdots\right)\left(1+a_1x+a_2x^2+\cdots+a_nx^n+\cdots\right)

deverá resultar em

-a_1x-2a_2x^2-3a_3x^3-\cdots-na_nx^n+\cdots

A comparação dos coeficientes com a mesma potência em ambas as expressões polinomiais proporciona

\begin{array}{l} \sigma(1)=-a_1\\ a_1\sigma(1)+\sigma(2)=-2a_2\\ a_2\sigma(1)+a_1\sigma(2)+\sigma(3)=-3a_3\\ \vdots\\ a_{n-1}\sigma(1)+a_{n-2}\sigma(2)+\cdots+\sigma(n)=-na_n \end{array}

Conclui-se que, conhecidos os coeficientes a_i da expansão de \pi_n, é possível obter a soma dos divisores de n quando são conhecidas as somas dos divisores dos números inferiores a n. De modo a obter essa expansão, é conveniente observar as seguintes propriedades de \pi_n(t,x).

\begin{array}{l} \pi_n(t,x)=\pi_{n-1}(xt,x)-tx\pi_{n-1}(xt,x)\\ \pi_n(t,x)=\pi_{n-1}(t,x)-t^nx^n\pi_{n-1}(t,x)\\ \end{array}

Em particular,

\pi_n=\pi_{n-1}-x^n\pi_{n-1}=\pi_{n-2}-x^{n-1}\pi_{n-2}-x^n\pi_{n-1}

que, de forma recursiva, conduz à identidade

\pi_n=1-\sum_{k=1}^{n}{x^{k}\pi_{k-1}}

onde se convenciona \pi_0=1. Faz-se

f_n(t,x)=\sum_{k=1}^n{x^{k-1}t^{k-1}\pi_k(t,x)}

de modo que \pi_n=1-x-x^2f_{n-1}(t,x). Como

\pi_k(t,x)=\pi_{k-1}(xt,x)-tx\pi_{k-1}(tx,x)

segue-se que

f_n(t,x)=\sum_{k=1}^{n}{x^{k-1}t^{k-1}\left\lbrack \pi_{k-1}(xt,x)-tx\pi_{k-1}(xt,x)\right\rbrack}

que se pode simplificar em

f_n(t,x)=1-x^nt^n\pi_{n-1}(xt,x)-\sum_{k=1}^n{x^kt^k\left\lbrack \pi_k(xt,x)-\pi_{k-1}(xt,x)\right\rbrack}

Porém, como \pi_k(xt,x)-\pi_{k-1}(xt,x)=-tx^{k+1}\pi_{k-1}(xt,x), vem

f_n(t,x)=1-x^3t^2-x^nt^n\pi_{n-1}(xt,x)-x^3t^2\sum_{k=1}^{n-2}{x^{2k}t^k\pi_k(xt,x)}

ou

f_n(t,x)=1-x^3t^2-x^nt^n\pi_{n-1}(xt,x)-x^5t^3f_{n-2}(xt,x)

Ora, segue-se daqui que

f_{n}(tx^r,x)=1-x^{3+2r}t^2-x^{(r+1)(n-2)}t^{n-2}\pi_{n-3\left(tx^2,x\right)}-x^{5+3r}t^4f_{n-4}\left(tx^{r+1},x\right)

Estas fórmulas, quando aplicadas recursivamente, conduzem ao resultado

f_n(t,x)=P_n(t,x)+\sum_{k=0}^{\left\lfloor\frac{n}{2}\right\rfloor}{(-1)^kx^{\frac{k(3k+7)}{2}}t^{3k}}+t^2\sum_{k=0}^{\left\lfloor\frac{n}{2}\right\rfloor}{(-1)^{k+1}x^{\frac{(k+3)(3k+2)}{2}}t^{3k}}

onde P_n(t,x) é um polinómio cujo termo de menor grau é de grau igual a n. Fazendo t=1 e atendendo à expressão para \pi_n em termos de f_{n-1}(1,x), obtém-se

\pi_n=p_n(x)+\sum_{k=-\left\lfloor\frac{n}{2}\right\rfloor}^{\left\lfloor\frac{n}{2}\right\rfloor}{(-1)^kx^{\frac{k(3k-1)}{2}}}

onde o menor grau de P_n(x) é superior a n. Quando n\to+\infty obtém-se

\prod_{n=1}^{+\infty}{(1-x^n)}=\sum_{n=-\infty}^{+\infty}{(-1)^nx^{\frac{n(3n-1)}{2}}}

e o resultado é conhecido como teorema dos números pentagonais uma vez que é este tipo de números que surge no expoente. É óbvio que a identidade é apenas válida na região de convergência.

Dass considerações acima expostas, a comparação dos coeficientes dos polinómios até ao grau n, permitem chegar à fórmula de recursão

\sigma(n)=\sum_{k\in\mathbb{Z}-\left\lbrace 0\right\rbrace}{\sigma\left(n-\frac{k(3k-1)}{2}\right)}

onde \sigma(k)<0 se k<0 e \sigma(n-n)=n. A interessante fórmula de recursão proporciona o valor da soma dos divisores de um número quando são conhecidas as somas dos divisores dos números inferiores.

Publicado em Matemática | Etiquetas , , , | Publicar um comentário

Noções de matemática

Já faz algum tempo que decidi investigar e colmatar algumas das falhas de apresentação de ideias quando é ensinada matemática. Por exemplo, no ensino primário somos expostos aos conhecidos algoritmos da adição, subtracção multiplicação e divisão. Não creio que  a sua justificação ou demonstração do seu funcionamento deva ser exposta neste nível. Porém, no decurso de toda a minha formação, com forte componente matemática, nunca retornara a este tema. Sabemos que os algoritmos funcionam mas não sabemos propriamente porquê.

É claro que, de um ponto de vista estritamente formal, é necessário estabelecer um sistema axiomático do qual se possam extrair os teoremas relevantes de uma teoria de números. Do qual se possam, extrair como resultados, os algoritmos associados às operações elementares. Este facto parece relegar este tópico para o âmbito da matemática abstracta. No entanto, sendo bem conhecido e simples o processo de contagem, não é completamente descabido partir daí até chegar às propriedades e resultados sobre os quais se possam basear os algoritmos associados às operações elementares sem ser necessário explorar um sistema axiomático. De facto, a matemática tem vindo a ser ensinada no ensino primário e secundário sobre um fundamento mais intuitivo do que axiomático.

O mesmo sucede com a geometria. O pensamento geométrico está tão embrenhado na mente como o processo de contagem. Sabe-se desde muito cedo reconhecer a vantagem de possuir duas maçãs sobre possuir apenas uma. Duas maçãs proporcionam melhores hipóteses de sobrevivência do que uma. As hipóteses de sobrevivência aumentam quando melhor se avaliam as distâncias. Fugir de um predador, esgueirando-se por uma pequena abertura aumenta a hipótese de sobrevivência se este ficar impedido de o fazer, não importa que posição escolha para o efeito. Neste avaliação estão implicitamente envolvidos os conceitos de forma, rotação e translação. A simples análise do problema sobre passar um objecto com uma determinada forma por uma abertura conduz a grande parte dos conceitos geométricos. O grande salto parece-me estar na sua extrapolação à resolução de problemas de astrometria.

Outro problema que me intrigou prendeu-se com a racionalização de denominadores. Sabemos que qualquer expressão racional em \sqrt{n}, onde n não é quadrado perfeito admite uma representação polinomial, isto é, é possível eliminar as expressões radicais do denominador. Não demorou muito até que tenha surgido a questão sobre se é ou não possível a racionalização de denominadores nas expressões racionais que envolvam \sqrt[3]{n}, onde n não é um cubo perfeito. A questão pode ainda ser levada adiante, imaginando a possibilidade de racionalizar denominadores que contenham uma combinação polinomial tanto de raízes quadradas como de raízes cúbicas. O facto de ser possível racionalizar qualquer denominador que contenha uma combinação de qualquer número algébrico assume um papel preponderante na demonstração da impossibilidade da resolução de equações de grau superior ou igual a cinco por intermédio da combinação das operações elementares e extracção de raízes. O conceito, por si só, não é tão elaborado quanto isso.

Relativamente à análise, sempre fui curioso sobre como eram calculadas no passado as tabelas das razões trigonométricas e de logaritmos. Um método para a determinação de uma tabela para o seno é descrito no Almagesto. Nesse livro são demonstrados resultados equivalentes às actuais fórmulas de adição, subtracção, duplicação e obtenção de metades de ângulos, nomeadamente,

\begin{array}{l} \sin{(x+y)}=\sin{x}\cos{y}+\sin{y}\cos{x}\\ \sin{(x-y)}=\sin{x}\cos{y}-\sin{y}\cos{x}\\ \sin{2x}=2\sin{x}\cos{x}\\ \sin{\frac{x}{2}}=\sqrt{\frac{1-\cos{x}}{2}} \end{array}

Os valores das razões trigonométricas dos ângulos 45^{\circ}, 30^{\circ}, 60^{\circ}, 72^{\circ} e 18^{\circ} determinam-se, considerando as propriedades dos quadrados e triângulos isósceles e escalenos. A fórmula para a determinação do seno de metade de 30^{\circ} permite determinar o valor da razão no ângulo 15^{\circ}. A fórmula da diferença permite determinar o seno de 3^{\circ}. A fórmula da soma permite determinar o valor do seno na sequência de ângulos 3^{\circ}, 6^{\circ}, 9^{\circ}, \cdots. As mesmas fórmulas permite determinar os valores do seno nos pontos médios, nomeadamente, na sequência de ângulos 1,5^{\circ}; 3,5^{\circ}; 4,5^{\circ}; \cdots e assim sucessivamente. A sequência é refinada até que os valores do seno nos pontos médios coincidam com os valores num dos ângulos extremos na precisão que se está a considerar. A determinação do valor dos logaritmos é muito semelhante já que as fórmulas de adição para a exponencial adquire um carácter mais simples, isto é, 10^{x+y}=10^x10^y. Por seu turno, 10^{\frac{x}{2}}=\sqrt{10}, 10^1=10 e 10^0=1. Segue-se daqui que, por exemplo, 10^{\frac{1}{2}}=\sqrt{10}. Também 10^{\frac{1}{4}}=\sqrt{\sqrt{10}} e 10^{\frac{3}{4}}=\left(10^{\frac{1}{4}}\right)^3. O procedimento pode ser continuado até que se obtenha uma sequência de valores do expoente suficientemente refinada quando relacionada com a precisão desejada.

Foi com o intuito de responder a estas e algumas outras questões que iniciei o trabalho Noções de matemática. Não se trata de um trabalho terminado mas já se encontra suficientemente elaborado para aqui ser considerado.

Publicado em Matemática | Etiquetas , , , , , , , , | Publicar um comentário

Demonstrações do teorema do binómio e algumas consequências

Existem essencialmente três tipos de demonstrações do teorema do binómio com expoente inteiro positivo, do tipo algébrico, do tipo combinatório ou probabilístico ou baseadas no cálculo diferencial. A prova algébrica mais conhecida baseia-se na aplicação do método de indução desde que seja conhecida, à partida, a forma para os coeficientes. Nas outras provas, apesar da forma dos coeficientes ser construída, assentam em princípios não algébricos para demonstrar um resultado algébrico.

Começa-se aqui por considerar a prova algébrica habitual e por expôr uma motivação para o estabelecimento da forma dos coeficientes. De seguida, é apresentada uma prova algébrica na qual a forma dos coeficientes é construída.

É bem conhecida a expansão binomial

\left(x+y\right)^n=\sum_{k=0}^n{\binom{n}{k}x^{n-k}y^k}

com n inteiro positivo e

\binom{n}{k}=\frac{n!}{k!(n-k)!}

são conhecidos por coeficientes binomiais.

A prova algébrica usual assenta no método de indução, começando por ser observado que

(x+y)^1=\binom{1}{0}x+\binom{1}{1}y

isto é, a fórmula vale para n=1. Supondo agora que vale para n, tem-se

(x+y)^{n+1}=(x+y)(x+y)^n=(x+y)\sum_{k=0}^n{\binom{n}{k}x^{n-k}y^k}

que, após efectuar a expansão com base na propriedade distributiva, fica

(x+y)^{n+1}=x^{n+1}+y^{n+1}+\sum_{k=1}^{n}{\left(\binom{n}{k-1}+\binom{n}{k}\right)x^{n+1-k}y^k}

Da fórmula que proporciona os coeficientes binomiais mostra-se facilmente as identidades

\binom{n}{0}=\binom{n}{n}=1

qualquer que seja o valor de n e

\binom{n}{k-1}+\binom{n}{k}=\binom{n+1}{k}

Segue-se que

(x+y)^{n+1}=\sum_{k=0}^{n+1}\binom{n+1}{k}x^{n+1-k}y^k

como era pretendido.

Resta estabelecer uma motivação para a fórmula

\binom{n}{k}=\frac{n!}{k!(n-k)!}

Para o efeito, talvez seja útil considerar a expansão do binómio no caso dos primeiros valores para n.

\begin{array}{l} (x+y)^1=x+y\\ (x+y)^2=x^2+2xy+y^2\\ (x+y)^3=x^3+3x^2y+3xy^2+y^3\\ (x+y)^4=x^4+4x^3y+6x^2y^2+4xy^3+y^5\\ (x+y)^5=x^5+5x^4y+10x^3y^2+10x^2y^3+5xy^4+y^5\\ \vdots \end{array}

Determine-se o quociente dos valores consecutivos de cada linha.

\begin{array}{l} \frac{1}{1}\\ \frac{2}{1},\frac{1}{2}\\ \frac{3}{1},\frac{2}{2},\frac{1}{3}\\ \frac{4}{1},\frac{3}{2},\frac{2}{3},\frac{1}{4}\\ \frac{5}{1},\frac{4}{2},\frac{3}{3},\frac{2}{4},\frac{1}{5}\\ \vdots \end{array}

Note-se que as fracções não foram colocadas na forma irredutível. Foram aqui escolhidas por forma a tornar claro o padrão

\binom{n}{k}=\frac{n-k}{k}\binom{n}{k-1}

Esta fórmula, aplicada recursivamente, conduz à expressão utilizada na demonstração por indução.

Pretende-se, portanto, uma demonstração que permita a determinação da forma para os coeficientes de forma construtiva.

Demonstração algébrica do teorema do binómio

Seja p(x) um polinómio de grau n>1 da forma

p(x)=p_nx^n+p_{n-1}x^{n-1}+\cdots+p_1x+p_0

A divisão de p(x) por x-y permite escrever

p(x)=p(y)+(x-y)q(x,y)

ou

p(x)-p(y)=(x-y)q(x,y)

onde

q(x,y)=x^{n-1}+\left(y+p_{n-1}\right)x^{n-2}+\cdots+\left(y^{n-1}+y^{n-2}p_{n-1}+\cdots+p_1\right)

A equação p(x)=p(y)+(x-y)q(x,y) pode ser reescrita na forma p(y)=p(x)+(y-x)q(x,y) e o algoritmo da divisão, considerando o polinómio em y, proporciona p(y)=p(x)+(y-x)q(y,x). Então

q(x,y)=q(y,x)

Suponha-se agora que a é raiz de ordem k de p(x). A aplicação sucessiva do algoritmo da divisão permite concluir a representação

p(x)=(x-a)^kr(x)

onde r(x) é um polinómio de grau n-k. Da sua substituição na equação p(x)-p(y)=(x-y)q(x,y) advém a identidade

(x-a)^kr(x)-(y-a)^kr(y)=(x-y)q(x,y)

A equação anterior pode ser colocada na forma

r(x)\left\lbrack (x-a)^k-(y-a)^k\right\rbrack+(y-a)^k\left\lbrack r(x)-r(y)\right\rbrack=(x-y)q(x,y)

A expressão para a série geométrica permite concluir a identidade

(x-a)^k-(y-a)^k=(x-y)\left\lbrack (x-a)^{k-1}+(x-a)^{k-2}(y-a)+\cdots+(y-a)^{k-2}\right\rbrack

isto é, (x-a)^k-(y-a)^k=(x-y)\psi(x,y) onde \psi(x,y) é dado pelo membro direito da equação acima. Por seu turno, y é raiz do polinómio r(x)-r(y) e, portanto, r(x)-r(y)=(x-y)\chi(x,y) para algum polinómio \chi(x,y). Segue-se que

(x-y)q(x,y)=(x-y)\left\lbrack r(x)\psi(x,y)+(y-a)^k\chi(x,y)\right\rbrack

ou, considerando o algoritmo da divisão e a igualdade de polinómios,

q(x,y)=r(x)\psi(x,y)+(y-a)^k\chi(x,y)

A substituição de y por x conduz a

q(x,x)=(x-a)^{k-1}\left\lbrack nr(x)+(x-a)\chi(x,x)\right\rbrack

Segue-se daqui que se a for um zero de ordem k de p(x) então é um zero de ordem k-1 do polinómio q(x,x), isto é, de

p'(x)=q(x,x)=nx^{n-1}+(n-1)p_{n-1}x^{n-1}+(n-2)p_{n-2}x^{n-3}+\cdots+p_1

O mesmo argumento permite justificar que, sendo a um zero de ordem k-1 de p'(x), é zero de ordem k-2 do polinómio

p''(x)=n(n-1)x^{n-2}+(n-1)(n-2)p_{n-1}x^{n-3}+\cdots+2\times 1p_2

e assim sucessivamente até que a é um zero simples do polinómio

p^{(k-1)}(x)=\frac{n!}{(n-k+1)!}x^{n-k+1}+\frac{(n-1)!}{(n-k)!}p_{n-1}x^{n-k}+\cdots+\frac{(k-1)!}{0!}p_{k-1}

Segue-se da discussão anterior que se a for um zero de ordem n de p(x) então é um zero da sequência de polinómios p'(x), p''(x), …, p^{(n-1)}(x), isto é,

\left\lbrace\begin{array}{l} \frac{n!}{1!}a+\frac{(n-1)!}{0!}p_{n-1}=0\\ \frac{n!}{2!}a^2+\frac{(n-1)!}{1!}p_{n-1}a+\frac{(n-2)!}{0!}=0\\ \frac{n!}{3!}a^3+\frac{(n-1)!}{2!}a^2p_{n-1}+\frac{(n-2)!}{1!}ap_{n-2}+\frac{(n-3)!}{0!}p_{n-3}=0\\ \vdots\\ \frac{n!}{n!}a^n+\frac{(n-1)!}{(n-1)!}p_{n-1}a^{n-1}+\cdots+\frac{0!}{0!}p_{0}=0 \end{array}\right.

Note-se que a última equação é dada precisamente por p(a)=0. Resolve-se a primeira equação e substitui-se o valor encontrado nas seguintes, vindo

\left\lbrace\begin{array}{l} p_{n-1}=-\frac{n!}{(n-1)!1!}a\\ -\frac{n!}{2!}a^2+\frac{(n-2)!}{0!}p_{n-2}=0\\ -2\frac{n!}{3!}a^3+\frac{(n-2)!}{1!}ap_{n-2}+\frac{(n-3)!}{0!}p_{n-3}=0\\ \vdots\\ -(n-1)!\frac{n!}{n!}a^n+\frac{(n-2)!}{(n-2)!}p_{n-2}a^{n-2}+\cdots+\frac{0!}{0!}p_{0}=0 \end{array}\right.

Da segunda equação determina-se p_{n-2} e substitui-se nas restantes para se obter

\left\lbrace\begin{array}{l} p_{n-1}=-\frac{n!}{(n-1)!1!}a\\ p_{n-2}=\frac{n!}{2!(n-2)!}a^2\\ \frac{n!}{3!}a^3+\frac{(n-3)!}{0!}p_{n-3}=0\\ \vdots\\ \frac{n!}{n!}a^n+\frac{(n-3)!}{(n-3)!}p_{n-3}a^{n-3}+\cdots+\frac{0!}{0!}p_{0}=0 \end{array}\right.

A solução do sistema proporciona, portanto,

p_k=(-1)^{n-k}\frac{n!}{(n-k)!k!}a^{n-k}

isto é,

(x-a)^n=x^n-\frac{n!}{1!(n-1)!}x^{n-1}a+\frac{n!}{2!(n-2)!}x^{n-2}a^2+\cdots

A substituição de a por -a conduz à forma

(x+a)^n=\sum_{k=0}^n{\frac{n!}{k!(n-k)!}x^{n-k}a^k}

como era pretendido mostrar.

É útil notar que, nesta demonstração, não foi necessário assumir à partida que o binómio (x+a)^n admite uma representação na forma canónica. Com efeito, mostrou-se que, partindo de uma forma canónica genérica, uma escolha adequada dos coeficientes permite obter a igualdade pretendida. É importante notar que também não foi mostrado que a escolha dos coeficientes é única.

Demonstração alternativa

A prova anterior pode ser simplificada se se assumir que o binómio admite uma representação na forma canónica. Seja a igualdade

(x+a)^n=x^n+p_{n-1}x^{n-1}+\cdots+p_1x+a^n

que facilmente se demonstra por intermédio do método da indução como na demonstrção habitual. A prova fica concluída quando for determinada uma forma fechada para os coeficientes. A bem conhecida fórmula para  a soma de uma série geométrica permite escrever

x^n-y^n=(x-y)\psi_{n-1}(x,y)

em que

\psi_{n-1}(x,y)=x^{n-1}+x^{n-2}y+\cdots+xy^{n-2}+y^n

Então, a igualdade

(x+a)^n-(y+a)^n=x^n-y^n+p_{n-1}\left(x^{n-1}-y^{n-1}\right)+\cdots+p_1(x-y)

pode ser escrita na forma

(x-y)\psi(x+a,y+a)=(x-y)\left(\psi_{n-1}(x,y)+p_{n-1}\psi_{n-2}(x,y)+\cdots+p_1\psi_0(x,y)\right)

A aplicação do algoritmo da divisão a cada um dos polinómios permite concluir

\psi_{n-1}(x+a,y+a)=\psi_{n-1}(x,y)+p_{n-1}\psi_{n-2}(x,y)+\cdots+p_1\psi_0(x,y)

Fazendo x=y na identidade anterior vem

n(x+a)^{n-1}=nx^{n-1}+(n-1)p_{n-1}x^{n-2}+\cdots+2p_2x+p_1

O mesmo procedimento permite mostrar que

n(n-1)(x+a)^{n-2}=n(n-1)x^{n-2}+(n-1)(n-2)p_{n-1}x^{n-3}+\cdots+2p_2

De um modo geral, mostra-se que

\frac{n!}{(n-k)!}(x+a)^{n-k}=\frac{n!}{(n-k)!}x^{n-k}+p_{n-1}\frac{(n-1)!}{(n-1-k)!}x^{n-1-k}+\cdots+p_k\frac{k!}{0!}

A substituição x=0 na expressão anterior conduz ao resultado

p_k=\frac{n!}{k!(n-k)!}

que corresponde à conhecida fórmula que proporciona os coeficientes binomiais.

Uma generalização do procedimento anterior

Seja novamente

p(x)=x^n+p_{n-1}x^{n-1}+\cdots+p_1x+p_0

um polinómio de grau n. A divisão sucessiva dos vários quocientes pelo factor linear x-a permite escrever

p(x)=a_0+a_1(x-a)+a_2(x-a)^2+\cdots+a_n(x-a)^n

Ora, definindo

\psi_n(x,y)=x^n+x^{n-1}y+x^{n-2}y^2+\cdots+xy^{n-1}+y^n

sabe-se que x^n-y^n=(x-y)\psi_{n-1}(x,y) e, considerando p(x)-p(y)=(x-y)\psi(x,y) tem-se, por um lado,

\psi(x,y)=p_n\psi_{n-1}(x,y)+p_{n-1}\psi_{n-2}(x,y)+\cdots+p_1\psi_0(x,y)

e, por outro,

\psi(x,y)=a_1\psi_0(x-a,y-a)+a_2\psi_1(x-a,y-a)+\cdots+a_n\psi_{n-1}(x-a,y-a)

Da primeira das equações verifica-se imediatamente que

\psi(x,x)=p'(x)=p_1+2p_2x+3p_3x^2+\cdots+(n-1)x^n

e, igualando à segunda equação em que se considera y=x, vem

p'(x)=a_1+2a_2(x-a)+3a_3(x-a)^2+\cdots+na_n(x-a)^{n-1}

Definindo p^{(0)}(x)=p(x) e p^{(k+1)}(x)=\left\lbrack p^{(k)}(x)\right\rbrack', tem-se, de um modo geral,

p^{(k)}(x)=\frac{k!}{0!}a_k+\frac{(k+1)!}{1!}a_{k+1}(x-a)+\cdots+\frac{n!}{(n-k)!}a_n(x-a)^{n-k}

Fazendo agora x=a obtém-se

a_k=\frac{p^{(k)}(a)}{k!}

e, portanto,

p(x)=p(a)+\frac{p'(a)}{1!}(x-a)+\cdots+\frac{p^{(n-1)}(a)}{(n-1)!}(x-a)^{n-1}+\frac{p^{(n)}(a)}{n!}(x-a)^n

As funções p^{(k)}(x) desempenham um papel central em cálculo infinitesimal. É claro que, fazendo p^{(k)}(a)=0, se obtém

p(x)=(x-a)^n

Como já foi observado atrás, as equações p^{(k)}(a)=0 conduzem aos coeficientes da expansão.

Aplicação das ideias anteriores à interpolação polinomial

A fórmula

p(x)=p(a)+\frac{p'(a)}{1!}(x-a)+\cdots+\frac{p^{(n-1)}(a)}{(n-1)!}(x-a)^{n-1}+\frac{p^{(n)}(a)}{n!}(x-a)^n

permite construir automaticamente o polinómio p(x) de tal forma que p^{(k)}(a)=b_k com k=0,\cdots,n. De facto, o polinómio

p(x)=b_0+\frac{b_1}{1!}(x-a)+\cdots+\frac{b_{n-1}}{(n-1)!}(x-a)^{n-1}+\frac{b_n}{n!}(x-a)^n

satisfaz essas condições.

Definam-se as funções \psi_k\left(x_1,\cdots,x_n\right) por intermédio da recursão

\left\lbrace\begin{array}{l} \psi_k\left(x_1\right)=x_1^k\\ \psi_k\left(x_n,x_{n-1},\cdots,x_1\right)=\frac{\psi_{k+1}\left(x_{n},x_{n-2},\cdots,x_1\right)-\psi_{k+1}\left(x_{n-1},x_{n-2},\cdots,x_1\right)}{x_n-x_{n-1}} \end{array}\right.

Por exemplo,

\psi_k\left(x_2,x_1\right)=\frac{\psi_{k+1}\left(x_2\right)-\psi_{k+1}\left(x_1\right)}{x_2-x_1}=\frac{x_2^{k+1}-x_1^{k+1}}{x_2-x_1}

Da fórmula para a sucessão geométrica tem-se

\psi_k\left(x_2,x_1\right)=\sum_{i=0}^k{x_1^ix_2^{k-i}}

isto é,

\psi_k\left(x_2,x_1\right)=\sum_{i=0}^k{x_2^i\psi_{k-i}\left(x_1\right)}

É útil analisar aqui algumas das propriedades destas funções. O exemplo anterior pode ser escrito como

\psi_{k}\left(x_2,x_1\right)=\sum_{i=0}^k{x_2^{i}\psi_{k-i}\left(x_1\right)}

Então

\psi_{k}\left(x_3,x_2,x_1\right)=\sum_{i=0}^{k+1}{\frac{x_3^{i}-x_2^{i}}{x_3-x_2}\psi_{k-i}\left(x_1\right)}=\sum_{i=0}^k{\psi_{k-i}\left(x_1\right)}\sum_{j=0}^{i}{x_2^jx_3^{i-j}}

ou, invertendo a ordem da soma,

\psi_{k}\left(x_3,x_2,x_1\right)=\sum_{i=0}^k{x_3^i\sum_{j=0}^{k-i}{x_2^{j}\psi_{k-i-j}\left(x_1\right)}}=\sum_{i=0}^{k}{x_3^i\psi_{k-i}\left(x_2,x_1\right)}

O argumento utilizado, aliado ao método da indução, permite demonstrar a identidade

\psi_k\left(x_n,x_{n-1},\cdots,x_1\right)=\sum_{i=0}^k{x_n^i\psi_{k-i}\left(x_{n-1},\cdots,x_1\right)}

que é o mesmo que

\psi_k\left(x_n,x_{n-1},\cdots,x_1\right)=\sum_{i=0}^k{\psi_i\left(x_n\right)\psi_{k-i}\left(x_{n-1},\cdots,x_1\right)}

O mesmo procedimento permite mostrar que

\psi_k\left(x_n,x_{n-1},\cdots,x_1\right)=\sum_{i=0}^k{\psi_i\left(x_1\right)\psi_{k-i}\left(x_{n},\cdots,x_2\right)}

As identidades anteriores aplicadas recursivamente conduzem a

\psi_k\left(x_n,x_{n-1},\cdots,x_1\right)=\sum_{i=0}^k{\psi_i\left(x_n,x_{n-1},\cdots,x_{r}\right)\psi_{k-i}\left(x_{r-1},x_{r-2}\cdots,x_1\right)}

Mais uma vez, a aplicação recursiva da identidade anterior permite concluir a fórmula mais geral

\psi_k\left(x_n,\cdots,x_1\right)=\sum_{k_1+\cdots+k_m=k}{\psi_{k_1}\left(x_n,\cdots,x_{r_1}\right)\psi_{k_2}\left(x_{r_1-1},\cdots,x_{r_2}\right)\cdots\psi_{k_m}\left(x_{r_{m-1}-1},\cdots,x_{1}\right)}

Em particular,

\psi_k\left(x_n,x_{n-1},\cdots,x_1\right)=\sum_{k_1+k_2+\cdots+k_n=k}{x_1^{k_1}x_2^{k_2}\cdots x_n^{k_n}}

e, portanto, \psi_k\left(x_n,x_{n-1},\cdots,x_1\right) é simétrica nos argumentos e é igual à soma de todos os monómios de grau k nas variáveis.

As fórmulas anteriores permitem determinar a forma dos polinómios quando algumas das variáveis adquirem o mesmo valor. Com efeito,

\psi_n(x,x)=\sum_{i=0}^n{x^ix^{n-i}}=(n+1)x^n

Por seu turno,

\psi_n(x,x,x)=\sum_{i=0}^n{x^i\psi_{n-i}(x,x)}=x^n\sum_{k=0}^{n}{(k+1)}=\binom{n+2}{2}x^n

de onde se segue que

\psi_n(x,x,x,x)=\sum_{i=0}^n{x^i\psi_{n-i}(x,x,x)}=x^n\sum_{k=0}^{n}{\binom{k+2}{2}}=\binom{n+3}{3}x^n

e, de um modo geral,

\psi_n(\underbrace{x,\cdots,x}_{m})=\binom{n+m-1}{m-1}x^n

Mais uma demonstração do teorema do binómio

As funções \psi_n(x,\cdots,x) podem ser usadas para demonstrar o teorema do binómio do seguinte modo. Ora, da definição de \psi_n(x,y) obtem-se

(x+y)^n=y^n+x\psi_{n-1}(x+y,y)

Por seu turno, \psi_{n-1}(x,y)=\psi_n(y,y)+x\psi_{n-2}(x+y,y,y) e, portanto,

(x+y)^n=y^n+\psi_{n-1}(y,y)x+\psi_{n-2}(x+y,y,y)x^2

O processo pode ser exectuado de forma recursiva até ficar

(x+y)^n=y^n+\psi_{n-1}(y,y)x+\cdots+\psi_1(x+y,\underbrace{y,\cdots,y}_{n-1})x^{n-1}

Porém,

\psi_1(x+y,\underbrace{y,\cdots,y}_{n-1})=x+y+(n-1)y=x+ny

Dado que

\binom{n}{n-1}=n

e, atendendo à fórmula para as funções \psi_n(y,\cdots,y), vem finalmente

(x+y)^n=\sum_{k=0}^n{\binom{n}{k}x^{k}y^{n-k}}

que corresponde à fórmula do binómio que se pretendia mostrar.

Interpolação polinomial simples

Seja agora x_1,\cdots,x_n uma colecção de valores distintos entre si e seja

p(x)=\sum_{k=0}^n{p_k\psi_k(x)}

Notando que \psi_k(x)=\psi_k\left(x_1\right)+\left(x-x_1\right)\psi_{k-1}\left(x,x_1\right), segue-se que

p(x)=\sum_{k=0}^n{p_k\psi_k\left(x_1\right)}+\left(x-x_1\right)\sum_{k=0}^{n-1}{p_{k+1}\psi_k\left(x,x_1\right)}

isto é,

p(x)=p\left(x_1\right)+\left(x-x_1\right)\frac{p(x)-p\left(x_1\right)}{x-x_1}

Trata-se de uma identidade válida para todo o x, considerando que a fracção denota o polinómio que resulta da da divisão de p(x)-p\left(x_1\right) por x-x_1. Voltando a aplicar uma identidade idêntica sobre \psi_k\left(x,x_1\right) obtém-se

p(x)=\sum_{k=0}^n{p_k\psi_k\left(x_1\right)}+\left(x-x_1\right)\sum_{k=0}^{n-1}{p_{k+1}\psi_k\left(x_2,x_1\right)}+\left(x-x_1\right)\left(x-x_2\right)\sum_{k=0}^{n-2}{p_{k+2}\psi_k\left(x,x_2,x_1\right)}

Definam-se, de forma recursiva, as funções

\left\lbrace\begin{array}{l} [x]=p(x)\\ \left\lbrack x,x_n,x_{n-1},\cdots,x_1\right\rbrack=\frac{\left\lbrack x,x_{n-1},\cdots,x_1\right\rbrack-\left\lbrack x_n,x_{n-1},\cdots,x_1\right\rbrack}{x-x_n} \end{array}\right.

O mesmo argumento aplicado de forma recursiva conduz ao resultado

p(x)=\left\lbrack x_1\right\rbrack+\left\lbrack x_2,x_1\right\rbrack\left(x-x_1\right)+\left\lbrack x_3,x_2,x_1\right\rbrack\left(x-x_1\right)\left(x-x_2\right)+\cdots+\left\lbrack x_n,\cdots,x_1\right\rbrack\left(x-x_1\right)\cdots\left(x-x_n\right)

uma vez que

\left\lbrack x_m,\cdots,x_1\right\rbrack=\sum_{k=0}^{n-m+1}{p_{k+m-1}\psi_k\left(x_m,\cdots,x_1\right)}

Note-se que os valores \left\lbrack x_m,\cdots,x_1\right\rbrack dependem apenas dos valores x_1,\cdots,x_m e a_1,\cdots,a_m se se fizer a_i=p\left(x_i\right). Assim, para determinar um polinómio de grau n, p(x), tal que p\left(x_i\right)=a_i com i=1,\cdots,n, é suficiente determinar as quantidades \left\lbrack x_m,\cdots,x_1\right\rbrack e substituir na expressão anterior.

Interpolação polinomial com derivadas

Foi atrás mostrado que, caso x_1 seja zero duplo do polinómio

p(x)=\sum_{k=0}^n{p_kx^k}

então é zero do polinómio

p'(x)=\sum_{k=0}^{n-1}{(k+1)p_{k+1}x^k}

Do ponto de vista geométrico, p'\left(x_1\right), proporciona o declive da recta tange ao gráfico de p(x) no ponto de abcissa x_1. De facto, se o grau do polinómio for superior a 1 então a recta tangente no ponto de abcissa x_1 terá de intersectar o seu gráfico em apenas um ponto, constituindo este, de um ponto de vista algébrio, um zero duplo da equação que resulta da intersecção. No caso em que o grau é unitário ou nulo, o seu gráfico, por si só, coincide com a recta tangente em qualquer ponto.

Poderá ser útil, por vezes, não só determinar um polinómio cujo gráfico passe por um conjunto de pontos distintos, mas que valores das suas derivadas sejam aí conhecidos.

Antes de se proceder à resolução do problema proposto, é necessário tecer algumas considerações adicionais sobre as funções \psi_n\left(x_n,\cdots,x_1\right) e estabelecer notações que permitam a sua simplificação. Denotam-se as sucessivas derivadas de p(x) por

p^{(k)}(x)=\frac{d^k p(x)}{dx^k}

Seja agora q\left(x_1,\cdots,x_n\right) um polinómio de grau n nas variáveis x_1,\cdots,x_n. A propriedade distributiva permite escrevê-lo na forma

\sum_{i=0}^{n}{q_i\left(x_1,\cdots,x_{k-1},x_{k+1},\cdots,x_n\right)x_k^i}

É possível, portanto, determinar a derivada de q\left(x_1,\cdots,x_n\right), considerando apenas a variável x_k e esta derivada denota-se por

\frac{\partial}{\partial x_k}q\left(x_1,\cdots,x_n\right)=\sum_{i=0}^{n-1}{(i+1)q_{i+1}\left(x_1,\cdots,x_{k-1},x_{k+1},\cdots,x_n\right)x_k^i}

A expressão \frac{\partial^2}{\partial x_{k}^2}q\left(x_1,\cdots,x_n\right) representa a derivada da derivada quando se considera x_k como variável e assim sucessivamente. A mesma notação permite determinar a derivada quando se consideram duas variáveis diferentes, por exemplo, \frac{\partial^2}{\partial x_1\partial x_2}q\left(x_1,\cdots,x_n\right) representa o polinómio que resulta da aplicação da derivada, considerando x_1 como variável após a aplicação da derivada, considerado x_2 como variável.

Não é tarefa árdua verificar que

\psi_n(\underbrace{x,\cdots,x}_{m+1})=\frac{1}{m!}\frac{d^m}{dx^m}x^m\psi_n(x)

De facto, das propriedades daquelas funções e desta última identidade segue o resultado mais geral

\psi_n(\underbrace{x_1,\cdots,x_1}_{m_1+1},\cdots,\underbrace{x_k,\cdots,x_k}_{m_k+1})=\frac{1}{m_1!\cdots m_k!}\frac{\partial^{m}}{\partial^{m_1}x_1\cdots\partial^{m_k}x_k}\left\lbrack x^{m_1}\cdots x^{m_k}\psi_n\left(x_1,\cdots,x_k\right)\right\rbrack

onde m=m_1+\cdots+m_k.

Se P\left(x_1,\cdots,x_n\right) for um polinómio de grau inferior a m então

\frac{\partial^m}{\partial^{m_1}x_1\cdots\partial^{m_k}x_k}P\left(x_1,\cdots,x_n\right)=0

e, portanto,

\left\lbrack\underbrace{x_1,\cdots,x_1}_{m_1+1},\cdots,\underbrace{x_k,\cdots,x_k}_{m_k+1}\right\rbrack=\frac{1}{m_1!\cdots m_k!}\frac{\partial^m}{\partial^{m_1}x_1\cdots\partial^{m_k}x_k}\left\lbrack x_1,\cdots,x_k\right\rbrack

Suponha-se, por exemplo, que do polinómio de grau n se conhece o seu valor no ponto de abcissa x_1 bem como as suas derivadas. Então,

p(x)=\left\lbrack x_1\right\rbrack+\left\lbrack x_1,x_1\right\rbrack\left(x-x_1\right)+\left\lbrack x_1,x_1,x_1\right\rbrack\left(x-x_1\right)^2+\cdots+\left\lbrack x_1,\cdots,x_1\right\rbrack\left(x-x_1\right)^n

isto é,

p(x)=\left\lbrack x_1\right\rbrack+\frac{d\left\lbrack x_1\right\rbrack}{dx_1}\left(x-x_1\right)+\frac{1}{2!}\frac{d^2\left\lbrack x_1\right\rbrack}{dx_1^2}\left(x-x_1\right)^2+\cdots+\frac{1}{n!}\frac{d^n\left\lbrack x_1\right\rbrack}{dx_1^n}\left(x-x_1\right)^n

que corresponde a uma fórmula já conhecida.

Não é difícil mostrar que as quantidades

\left\lbrack\underbrace{x_1,\cdots,x_1}_{m_1+1},\cdots,\underbrace{x_k,\cdots,x_k}_{m_k+1}\right\rbrack

dependem apenas dos valores x_i e dos valores que a função e as suas derivadas aí assumem. No entanto, dada a extensão do texto, tal resultado será demonstrado numa futura oportunidade.

Publicado em Matemática | Etiquetas , , | Publicar um comentário

Trigonometria esférica e geometria analítica

A astronomia de posição é o ramo da astronomia no qual se usam métodos na determinação da posição dos astros na esfera celeste. Dado que as observações podem ser efectuadas a partir de lugares com latitudes diferentes,  é natural a introdução de vários sistemas de coordenadas sobre a superfície esférica e a transformação definida sobre esses sistemas de coordenadas assenta em resultados de trigonometria esférica. Na determinação das transformações de coordenadas são usadas, com frequência, as leis dos senos e dos cossenos, que assumem um papel fundamental na resolução de problemas afins a triângulos esféricos.

Há pouco tempo pensei num problema que após obter a solução verifiquei estar directamente relacionado com a lei dos cossenos. O problema coloca-se do seguinte modo:

Sejam \vec{u}_1, \vec{u}_2 e \vec{u}_3 três vectores linearmente independentes. Considerem-se os vectores \vec{v}_1 simultaneamente perpendicular a \vec{u}_2 e \vec{v}_3\vec{v}_2 simultaneamente perpendicular a \vec{u}_3 e \vec{u}_1 e \vec{v}_3 simultaneamente perpendicular a \vec{u}_1 e \vec{u}_2. Dados os ângulos definidos entre pares de vectores formados por \vec{u}_1, \vec{u}_2 e \vec{u}_3, determinar os ângulos definidos entre os pares de vectores formados por \vec{v}_1, \vec{v}_2 e \vec{v}_3.

Como interessam apenas os ângulos definidos entre os vectores, considera-se que \vec{u}_1, \vec{u}_2 e \vec{u}_3 têm norma unitária. Os vectores que são simultaneamente perpendiculares a um par de vectores \vec{u}_i determinam-se por intermédio do produto vectorial

\begin{array}{l} \vec{v}_1=\vec{u}_2\times\vec{u}_3\\ \vec{v}_2=\vec{u}_3\times\vec{u}_1\\ \vec{v}_3=\vec{u}_1\times\vec{u}_2 \end{array}

O teorema que permite determinar o determinante do produto de matrizes (ver secção Determinante do produto de matrizes em Alguns resultados em teoria das matrizes) conduz à identidade

\left(\vec{u}\times\vec{v}\right)\cdot\left(\vec{w}\times\vec{t}\right)=\left\vert \begin{array}{cc} \vec{u}\cdot\vec{w} & \vec{u}\cdot\vec{t}\\ \vec{v}\cdot\vec{w} & \vec{v}\cdot\vec{t} \end{array} \right\vert

Segue-se daqui a identidade

\vec{v}_i\cdot\vec{v}_j=\left\vert\begin{array}{cc} \vec{u}_k\cdot\vec{u}_k & \vec{u}_k\cdot\vec{u}_j\\ \vec{u}_i\cdot\vec{u}_k & \vec{u}_i\cdot\vec{u}_j \end{array} \right\vert

onde se considera sempre i\ne j\ne k. Dado que os vectores \vec{u}_i são unitários, da conhecida fórmula para o produto escalar tem-se

\vec{u}_i\cdot\vec{u}_j=\cos\left(\left\langle\vec{u}_i,\vec{u}_j\right\rangle\right)

onde \left\langle\vec{u}_i,\vec{u}_j\right\rangle corresponde ao ângulo definido pelos vectores \vec{u}_i e \vec{u}_j que será denotado doravante por \alpha_k onde k é o valor do índice em \lbrace 1,2,3\rbrace diferente de i e j. Do mesmo modo, denota-se por A_k o ângulo definido pelos vectores \vec{v}_i e \vec{v}_j.

A fórmula para o produto escalar permite escrever

\cos{A_k}=\frac{\vec{v}_i\cdot\vec{v}_j}{\left\Vert\vec{v}_i\right\Vert\left\Vert\vec{v}_j\right\Vert}

Ora, é bem conhecida a fórmula que proporciona a norma do produto vectorial da qual resulta \left\Vert\vec{v}_i\right\Vert=\sin\alpha_i. Por seu turno, a expansão do determinante que proporciona \vec{v}_i\cdot\vec{v_j} permite escrever

\vec{v}_i\cdot\vec{v_j}=\cos\alpha_k-\cos\alpha_i\cos\alpha_j

Então o conjunto das três equações

\cos{A_k}=\frac{\cos\alpha_k-\cos\alpha_i\cos\alpha_j}{\sin\alpha_i\sin\alpha_j}

com k=1,2,3 e i\ne j\ne k permite determinar os ângulos dos vectores \vec{v}_i quando são conhecidos os ângulos entre os vectores \vec{u}_i. As equações são, portanto,

\begin{array}{l} \cos\alpha_1=\cos\alpha_2\cos\alpha_3+\sin\alpha_2\sin\alpha_3\cos{A_1}\\ \cos\alpha_2=\cos\alpha_3\cos\alpha_1+\sin\alpha_3\sin\alpha_1\cos{A_2}\\ \cos\alpha_3=\cos\alpha_1\cos\alpha_2+\sin\alpha_1\sin\alpha_2\cos{A_3} \end{array}

Reconhece-se de imediato a lei dos cossenos. Será agora tratado o problema, considerando que os vectores \vec{u}_i possam assumir uma norma não nula arbitrária. Neste caso, começa-se por definir a matriz U cujas entradas são dadas pelas entradas dos vectores \vec{u}_i dispostos em coluna. Os vectores \vec{v}_i são agora definidos por

\begin{array}{l} \vec{v}_1=\frac{\vec{u}_2\times\vec{u}_3}{|U|}\\ \vec{v}_2=\frac{\vec{u}_3\times\vec{u}_1}{|U|}\\ \vec{v}_3=\frac{\vec{u}_1\times\vec{u}_2}{|U|}\\ \end{array}

O factor dado pelo determinante |U| permite que seja verificada a identidade

\vec{u}_i\cdot\vec{v}_j=\delta_{ij}

onde

\delta_{ij}=\left\lbrace\begin{array}{ll}1, & i=j\\ 0, & i\ne j\end{array}\right.

Neste caso, se V for a matriz cujas entradas sejam dadas pelos vectores \vec{v}_i dispostas em colunas então V=U^{-1}, sendo inversas as matrizes U e V. Além disso, é claro que

\vec{u}_1=\alpha\vec{v}_2\times\vec{v}_3

onde \alpha é um escalar. Como \vec{v}_1\cdot\vec{u}_1=1, segue-se do produto escalar da equação anterior por \vec{v}_1 que

\vec{u}_1=\frac{\vec{v}_2\times\vec{v}_3}{|V|}

Do mesmo modo se deduzem as equações

\begin{array}{l} \vec{u}_2=\frac{\vec{v}_3\times\vec{v}_1}{|V|}\\ \vec{u}_3=\frac{\vec{v}_1\times\vec{v}_2}{|V|} \end{array}

Sabe-se que

\sin{\alpha_1}=\frac{\left\Vert\vec{u}_2\times\vec{u}_3\right\Vert}{\left\Vert\vec{u}_2\right\Vert\left\Vert\vec{u}_3\right\Vert}=\frac{|U|\left\Vert\vec{v}_1\right\Vert}{\left\Vert\vec{u}_2\right\Vert\left\Vert\vec{u}_3\right\Vert}

Do mesmo modo,

\sin{A_1}=\frac{\left\Vert\vec{v}_2\times\vec{v}_3\right\Vert}{\left\Vert\vec{v}_2\right\Vert\left\Vert\vec{v}_3\right\Vert}=\frac{|V|\left\Vert\vec{u}_1\right\Vert}{\left\Vert\vec{v}_2\right\Vert\left\Vert\vec{v}_3\right\Vert}

Então

\frac{\sin{\alpha_1}}{\sin{A_1}}=\frac{|U|}{|V|}\frac{\left\Vert\vec{v}_1\right\Vert\left\Vert\vec{v}_2\right\Vert\left\Vert\vec{v}_3\right\Vert}{\left\Vert\vec{u}_1\right\Vert\left\Vert\vec{v}_2\right\Vert\left\Vert\vec{v}_3\right\Vert}

A mesma fórmula é obtida quando se permutam os índices. Segue-se então a lei dos senos da forma

\frac{\sin{\alpha_1}}{\sin{A_1}}= \frac{\sin{\alpha_2}}{\sin{A_2}}= \frac{\sin{\alpha_3}}{\sin{A_3}}

que encontra par em trigonometria esférica.

Resta agora estabelecer a relação entre um problema sobre ângulos definidos entre vectores e ângulos definidos sobre triângulos esféricos. Para o efeito, sejam l_1, l_2 e l_3 três linhas que passam pela origem do referencial, tendo respectivamente \vec{u}_1, \vec{u}_2 e \vec{u}_3 por vectores directores. Como os vectores são linearmente independentes, nenhuma das linhas é coincidente com qualquer outra. Além disso, dado que estas se intersectam na origem, cada par de linhas define um plano. Designa-se por \pi_k o plano definido pelo par de linhas l_i e l_j com i\ne j\ne k. É claro que \vec{v}_k é um vector normal ao plano \pi_k.

Seja S a esfera centrada na origem com raio arbitrário. As linhas l_1, l_2 e l_3 intersectam a esfera em seis pontos diametralmente opostos. De entre as intersecções, escolhem-se três pontos P_1, P_2 e P_3, resultantes da intersecção das linhas l_1, l_2 e l_3 com a esfera de modo que possam definir um triângulo esférico. Neste caso, a intersecção do plano \pi_k, definido pelas rectas l_j e l_j irá intersectar a esfera no círculo máximo que passa pelos pontos P_i e P_j.

Posto isto, o arco definido entre os pontos P_i e P_j é igual ao ângulo compreendido entre as linhas l_j e l_j que se determina por intermédio dos vectores \vec{u}_i e \vec{u}_j. Por seu turno, o ângulo definido pelos planos que passam pela origem e contêm os arcos P_kP_i e P_kP_j é dado pelo ângulo entre os vectores normais \vec{v}_i e \vec{v}_j.

Publicado em Matemática | Etiquetas , , , | Publicar um comentário

Um integral em análise complexa

Um contorno em \mathbb{C} consiste numa curva diferenciável e direccionada

\gamma:\left\lbrack a,b\right\rbrack\in\mathbb{R}\to\mathbb{C}

sobre o plano complexo. O integral de caminho de uma função complexa f(z) sobre o contorno dado por \gamma é definido como

\int_C{f(z)dz}=\int_a^b{f\left(\gamma(t)\right)\gamma'(t)dt}

Pretende-se aqui determinar o integral de f(z)=z^n sobre o quadrado de lado 2 centrado na origem, definido pela sequência de curvas direccionadas

\begin{array}{cccc} t\to t-i, & t\to 1+it, & t\to -t+i, & t\to -1-it \end{array}

onde t\in\left\lbrack -1,1\right\rbrack. O problema por si só não é de difícil resolução. De facto, sabe-se que, quando n\ge 0, a função f(z) é analítica e, portanto, é nulo o integral qualquer que seja o caminho fechado escolhido. Por seu turno, quando n<0, o valor do integral é igual para todo o caminho fechado que envolva a origem. A escolha do círculo t\to e^{it}, com t\in\left\lbrack 0,2\pi\right\rbrack, permite escrever

\int_C{\frac{dz}{z^n}}=\int_0^{2\pi}{ie^{i(1-n)t}dt}=\left\lbrace\begin{array}{ll} 2\pi i, & n=1\\ 0, & n\ne 1\end{array}\right.

O integral sobre o quadrado será, portanto, igual ao integral sobre o círculo de raio unitário uma vez que ambas as curvas são fechadas e envolvem a origem. O exercício que se coloca consiste em determinar o integral sobre o quadrado, recorrendo directamente à definição. Ora, o integral I sobre o contorno é resultado da soma dos integrais sobre cada lado do quadrado. Assim,

I=\int_{-1}^1{\left\lbrack(t-i)^n+i(1+it)^n-(-t+i)^n-i(-1-it)^n\right\rbrack dt}

Se n for um número par, o integrando anula-se e, portanto, I=0. Se n for um número ímpar, o integral reduz-se a

I=2\int_{-1}^1{\left\lbrack (t-i)^n+i(1+it)^n\right\rbrack dt}

que, como i(1+it)^n=i^{n+1}(t-i)^n se simplifica em

I=2\left(1+i^{n+1}\right)\int_{-1}^1{(t-i)^n dt}

Uma vez que i^{4k}=1 para qualquer valor inteiro de k, o factor 1+i^{n+1} anula-se para valores de n da forma 4k+1 e, consequentemente, I=0 para valores de n dessa forma. Resta determinar o valor do integral para n=4k-1. É útil separar o cálculo do integral nos casos em que k=0 e k\ne 0. Se k\ne 0, o integral é dado por

I=4\int_{-1}^1{(t-i)^{4k-1}}=\frac{1}{k}\left\lbrack (1-i)^{4k}-(1+i)^{4k}\right\rbrack

Se k<0 e se fizer l=-k tem-se

I=\frac{1}{k}\frac{(1+i)^{4l}-(1-i)^{4l}}{2^{4l}}

A expansão do binómio permite concluir que (1+i)^4=(1-i)^4 e, portanto, I=0 para qualquer valor de n da forma 4k-1 com k\ne 0. Se k=0 tem-se

I=4\int_{-1}^1{\frac{dt}{1-i}}=4\log{\left(\frac{1-i}{-1-i}\right)}=2\pi i

já que

\log{\left(\frac{1-i}{-1-i}\right)}=\log{\left(\frac{e^{i\frac{7\pi}{4}}}{e^{i\frac{5\pi}{4}}}\right)}=\log{\left(e^{i\frac{\pi}{2}}\right)}=i\frac{\pi}{2}

Como todos os casos foram considerados, segue-se imediatamente o resultado

\int_C{z^ndz}=\left\lbrace\begin{array}{ll}0, & n\ne -1\\ 2\pi i, & n=-1\end{array}\right.

como seria de esperar.

Publicado em Matemática | Etiquetas , | Publicar um comentário