Postagens

Mostrando postagens com o rótulo LLM

LIMITATIONS OF LLMs IN PRECISION IMAGING TASKS

Imagem
  Ask an LLM (Large Language Model), or simply AI (Artificial Intelligence) model, to create an image that involves mathematical calculations that will be represented in it – something like "create an assessment which involves mathematical calculations based on an image containing a graph or geometric diagram that shows the problem to be solved". That is, ask the model to create a text assessment and a symbolic image that supports it. See the answer. You may have an unpleasant surprise: the calculations you asked for may not be exactly the way you imagined them to be in this image. This has some probability, not negligible, of happening. If you ask for the same thing WITHOUT the image, the answer will probably be much more accurate. After several tests in this perspective, there was evidence of errors as discussed in this paragraph. This can be treated as a type of limitation of the "mass" LLM models – general-purpose commercial models, accessible to the general pub...

LIMITAÇÕES DOS LLMs EM TAREFAS DE PRECISÃO QUE ENVOLVEM IMAGENS

Imagem
    Peça a um LLM (Large Language Model), ou simplesmente modelo de IA (Inteligência Artificial), para criar uma imagem que envolve cálculos matemáticos que serão nela representados – algo como “crie uma avaliação sobre uma habilidade da BNCC (Base Nacional Comum Curricular), com você especificando essa habilidade, que envolva cálculos matemáticos baseada em uma imagem contendo um gráfico ou diagrama geométrico que mostra o problema a ser resolvido ". Ou seja, peça que o modelo crie uma avaliação em texto e uma imagem simbólica que dê suporte a ele. Veja a resposta. Talvez, você tenha uma surpresa desagradável: os cálculos que você pediu podem não estar exatamente do jeito que você imaginou que estivessem nessa imagem. Isso tem alguma probabilidade, não desprezível, de acontecer. Se você pedir a mesma coisa SEM a imagem, provavelmente, a resposta será muito mais precisa. Depois de vários testes nessa perspectiva, houve evidência de erros como abordado nesse parágrafo. Po...