Sinopse

A inteligência artificial está avançando para além da compreensão textual: hoje, modelos capazes de interpretar imagens, sons e texto simultaneamente estão transformando a maneira como interagimos com máquinas. Neste livro, exploramos o poder dos Modelos de Linguagem Multimodal (MLLMs) com foco em aplicações práticas utilizando a linguagem Python e ferramentas modernas como o Hugging Face Transformers.

Por meio de exemplos claros e funcionais, como o uso do modelo BLIP (Bootstrapped Language-Image Pretraining) para geração automática de legendas a partir de imagens, o leitor aprenderá a desenvolver sistemas inteligentes que integram múltiplas formas de dados. O livro é ideal para estudantes, professores e profissionais que desejam compreender e aplicar conceitos de IA multimodal em seus projetos.

Com uma abordagem direta, prática e acessível, esta obra convida-o a mergulhar no futuro da computação — onde visão e linguagem caminham juntas para criar experiências verdadeiramente interativas e inteligentes.

Características

Número de páginas	108
Edição	1 (2025)
Formato	A5 (148x210)
Acabamento	Brochura c/ orelha
Tipo de papel	Couche 90g
Idioma	Português

Tem algo a reclamar sobre este livro? Envie um email para atendimento@clubedeautores.com.br

Vitor Amadeu Souza

Doutorando em Engenharia, Mestre em Física (CBPF), especialista em Eng.Robótica, Eng.Elétrica, Eng. Eletrônica e Eletromecânica, Eng.Telecomunicações, Eng.Controle e Automação, Eng.Biomédica, Eng.Instrumentação, Eng.Industrial 4.0, Eng.Dados, Eng.Computação, Eng.Software, Eng.Redes e Segurança de Dados, Eng.DevOps, Eng.Mecatrônica, Eng. Sistemas Embarcados, Eng.Manufatura Mecânica, Eng.Confiabilidade, Eng.Manutenção, Eng.Qualidade, Eng.Materiais, Eng.Produção, Eng. Produto, Eng.Embalagem, Eng. Transportes, Eng.Rodoviária, Eng.Suprimentos, Eng.Conhecimento, Eng.Negócios, Eng.Projetos, Eng.Energias Renováveis, Eng.Processos, Eng. Metalúrgica, Eng.Química, Eng.Ambiental, Arquitetura de Software, Cloud Computing, Machine Learning e IA, Internet das Coisas, Ciência de Dados, Full Stack, Estatística Aplicada, Bioestatística e Gerenciamento de Projetos. MBA em Eng. Econômica, Análise de Dados e Web 3.0. Bacharel em Engenharia de Computação, Licenciado em Matemática, Física, Química e Filosofia, Analista de Sistemas e Técnico em Eletrônica, Eletrotécnica, Telecomunicações, Informática, Logística, Comércio, Administração, Segurança do Trabalho e Meio Ambiente atuando na área de projetos elétricos, eletrônicos, automação, sistemas embarcados, firmware e software há vários anos. Desenvolvo projetos de hardware e software voltados para a área industrial, automotiva, médica, científica, comercial, automação dentre outras sob demanda. Professor universitário e administrador da Cerne Tecnologia, empresa voltada para desenvolvimento de projetos embarcados, comercialização de kits didáticos e educação tecnológica na área de MCU, FPGA, linguagens de programação, desenvolvimento de projetos e layout de circuito impresso. Ao longo dos anos escrevi vasto acervo literário técnico e científico. Alguns temas abordados: DFT, FFT, PDS, CAN, MODBUS, LIN, TCP/IP, Filtros digitais, Sistemas digitais, Sistemas de Potência, Big Data, Grafos, PID, Fuzzy, FPGA, VHDL, Verilog, CLP, DSC, DSP, ARM, inversor de frequência, soft-starter, energia solar, IoT, LoRa, Java, php, JS, REST, Spring Boot, Spark, CSS, SQL, VB, VC#, Perceptron, Robô NAO, UML, React, dentre outros. O catálogo completo está publicado no Clube de Autores (http://bit.ly/4gwnt78).

Linkedin: www.linkedin.com/in/engvitoramadeu

Cerne Tec: www.cerne-tec.com.br

Perfil completo Fale com o autor