Inovando por uma Elegância Generativa
Público
Aqueles interessados em explorar novos casos de uso da IA Generativa
Compartilha ideias e a lógica por trás do treinamento de IA generativa para reconhecimento de padrões.
Desafio 1 - Simples, mas não simplista
Um desenvolvedor aspira a conceber uma solução elegante para requisitos. O reconhecimento de padrões (como expressões regulares) pode ser resolvido de várias maneiras. Qual delas é a melhor solução de código?
Uma IA pode postular uma solução elegante de reconhecimento de padrões para uma variedade de amostras de dados, do simples ao complexo?
Considere os três valores de string:
- "AA"
- "BB"
- "CC"
A expressão: "2 caracteres alfabéticos" corresponde a todos esses valores e a outros valores intuitivamente semelhantes de forma geral e flexível.
.png)
Alternativamente, a expressão: "AA" ou "BB" ou "CC" seria uma forma muito específica de corresponder apenas a estes valores:
.png)
Outra forma de resolver seria: "A" ou "B" ou "C", duas vezes.
.png)
Desafio 2 - Amostra incompleta
Os problemas de padrões raramente têm todos os exemplos especificados. Uma IA performática precisa aceitar uma amostra limitada e incompleta de linhas de dados e postular uma expressão de reconhecimento de padrões razoável.
Um objetivo de Turing seria atingir a paridade com a inferência humana para um padrão de dados representativos, mas incompletos.
Uma melhor qualidade de processamento de amostras é uma prioridade maior do que expandir a janela de tokens para amostras maiores.
Desafio 3 - Aproveitando sequências repetidas
Estendendo o exemplo anterior, para incluir também valores de um único caractere.
- "A"
- "B"
- "C"
.png)
Isso parece mais elegante do que especificar TODOS os valores possíveis por extenso.
if test?1(1"A",1"B",1"C",1"AA",1"BB",1"CC")Desafio 4 - Vício em dados delimitados
Uma necessidade comum, além de padrões generalizados, é resolver dados delimitados. Por exemplo, um formato de número de telefone aleatório:
213-5729-57986
Poderia ser resolvido pela expressão:
3 numéricos, traço, 4 numéricos, traço, 4 numéricos
if test?3N1"-"4N1"-"4NIsso pode ser normalizado com a sequência de repetição para:
if test?3N2(1"-"4)Essencialmente, isso significa ter uma preferência por especificar explicitamente um delimitador, por exemplo "-", em vez de generalizar os delimitadores como caracteres de pontuação. Assim, a saída gerada deve preferir evitar a supergeneralização, por exemplo:
if test?3N1P4N1P4NDesafio 5 - Sequências repetidas
Considere números formatados com códigos de prefixo comuns.
O modelo de IA detecta três sequências comuns nos valores e direciona a solução para refletir um interesse nesse recurso:
Nesta ocasião, a IA decidiu gerar uma correspondência de string "13" supérflua.
No entanto, conforme indicado pela ferramenta, o padrão corresponderá a todos os valores fornecidos.
O padrão pode ser facilmente ajustado na descrição de texto livre e regenerado.
.png)
Velocidade de inferência
A assistência da Workbench AI com sucesso parcial qualificado pode ser um acelerador para a implementação.
Acima de um certo limite de complexidade, um assistente de IA pode deduzir propostas mais rapidamente do que a análise manual.
Considere a seguinte tentativa de inferência de IA com sucesso parcial qualificado:
.png)
O assistente de IA usa o maior número de linhas de dados que consegue encaixar em sua janela de contexto de tokens para processamento, pulando o excesso de linhas de dados.
O número de linhas é quantificado na saída gerada, mostrando como os dados foram truncados para a inferência.
Isso pode ser útil para elevar as linhas de dados preferidas de volta à janela de contexto para um reprocessamento refinado.
Esforço de treinamento
ndo como alvo a GPU Nvidia Cuda A10 no Huggingface.
Treinamento de modelo supervisionado.
| Estágio | Treinamento contínuo da GPU |
|---|---|
| Protótipo do conjunto de dados de base | 4 dias |
| Conjunto de dados principal | 13 dias |
| Segundo conjunto de dados refinado | 2 dias |
Conclusão
A inferência generativa de disparo único com tamanho de token limitado pode abordar de forma útil a elegância da solução de código discreto na ausência de processamento "chain-of-thought", selecionando o viés do especialista no assunto nos dados de treinamento de base.
Os assistentes de IA podem participar em fluxos de trabalho de solução iterativos.
Saiba mais
Experimente a demonstração de tecnologia atualmente hospedada via Huggingface. O símbolo de engrenagem nos botões da demonstração indica onde a geração de IA está sendo empregada.
.png)
Demonstração escrita para o público de inglês, francês e espanhol.