O conjunto de dados da Verifier Alliance agora tem 8M+ contratos verificados! @ethereum tem uma forte cultura de verificação, mas os dados são isolados e difíceis de acessar. Abrimos tudo no formato Parquet para pesquisadores, analistas e engenheiros de IA. Explore o esquema e baixe o conjunto de dados👇
@SourcifyEth @blockscout @routescan_io Para que serve esse conjunto de dados? - Teste do compilador - Identificação de padrões de vulnerabilidade em contratos - Modelos de treinamento - Análise de dados de contratos de EVM ... muitos outros casos de uso que não eram possíveis sem um conjunto de dados aberto Reunidos por @blockscout @routescan_io @SourcifyEth
Como são os dados? VerA é um banco de dados PostgreSQL com cada verificação sendo um acoplamento entre uma "implantação" e uma "compilação". Os bytecodes e fontes são desduplicados em tabelas separadas. Veja o esquema:
O bytecode EVM não é estruturado. Portanto, "transformações" marcam as alterações nos valores de dados necessárias para alcançar um bytecode onchain a partir de um bytecode recompilado. Isso inclui imutáveis, bibliotecas, cborAuxdata, constructorArguments, posições e valores
Todo o banco de dados é exportado diariamente em Parquet, um formato de dados moderno baseado em colunas que pode ser consultado diretamente. Vá até os documentos e veja como fazer o download:
80,94K