Fundador de EthStorage: disponibilidad de datos y almacenamiento descentralizado

Introducción

Esta es la última entrega de la serie de entrevistas de resumen descentralizado. Este episodio explora la descentralización de resumen desde la perspectiva de "disponibilidad de datos y almacenamiento descentralizado". Invitamos a Qi Zhou, el fundador de EthStorage, para discutir cómo DA puede reutilizar los atributos de seguridad de la red principal de Ethereum, EIP-4844 y danksharding, y la comparación de seguridad de diferentes modelos de DA. El profesor Zhou también presentó cómo se puede combinar EthStorage con EIP-4844 en la próxima actualización de Ethereum.

Presentación de invitados

Estoy muy feliz de compartir con ustedes algunos de nuestros pensamientos sobre toda la tecnología Ethereum DA y el almacenamiento descentralizado que hemos hecho en ella. Me uní a la industria Web3 a tiempo completo en 2018. Solía trabajar como ingeniero en grandes empresas como Google y Facebook. Y tiene un doctorado del Instituto de Tecnología de Georgia. Desde 2018, sigo y trabajo en la infraestructura Web3. La razón principal es que también hice esto en grandes fábricas antes, incluidos los sistemas distribuidos y el almacenamiento distribuido. Además, también creo que todavía hay mucho margen de mejora en este aspecto de toda la cadena de bloques. No importa lo que hicimos al principio, como la tecnología llamada fragmentación de ejecución. Esta es la fragmentación 1.0 de Ethereum, y ahora la tecnología denominada fragmentación de datos de la fragmentación 2.0 de Ethereum y la subsiguiente disponibilidad de datos. De hecho, son todas algunas innovaciones y trabajos que se prueban en toda la infraestructura de Web3.

Entonces, también estamos siguiendo de cerca la hoja de ruta de Ethereum, estudiando e investigando, y participando y mejorando de esta manera comunitaria. A fines del año pasado, nos sentimos muy honrados de recibir el apoyo de la Fundación Ethereum para nuestra investigación sobre "Muestreo de disponibilidad de datos". Ayude a la Fundación Ethereum a hacer un trabajo teórico, un trabajo de investigación sobre danksharding, incluido cómo recuperar datos de manera efectiva. Al mismo tiempo, también estamos desarrollando EthStorage, una capa de datos de Ethereum basada en la tecnología DA de Ethereum. Podemos usar los contratos inteligentes de Ethereum para verificar el almacenamiento de datos fuera de la cadena a escala. Esto también es muy significativo para Ethereum. Así que estoy muy feliz de compartir con ustedes hoy, incluso cómo EthStorage puede construir mejor una red de capas de almacenamiento de datos basada en la tecnología DA.

Sección de entrevistas

Parte 1: Discusión sobre la definición de DA

Cómo la disponibilidad de datos (DA) mantiene seguros los paquetes acumulativos

En primer lugar, en el proceso de investigación de DA, también descubrí que muchas personas no entienden la definición de DA. También estoy muy feliz de discutirlo hoy. Antes de eso, también hablé de DA con muchos miembros de la Fundación Ethereum, como Dankrad Feist, y el importante papel que juega DA en todo Ethereum L2.

Mencioné algunos mecanismos de trabajo básicos del paquete acumulativo de Ethereum, cómo mover las transacciones en la cadena a la cadena externa y luego usar una serie de métodos de prueba (prueba de fraude y prueba de validez) para decirle al contrato inteligente L1 que estos resultados de ejecución son aceptables Pruébese que es verdad por medio de estas pruebas.

Luego, un núcleo muy importante es que esperan reutilizar la seguridad de la propia red Ethereum, pero al mismo tiempo poder expandir en gran medida todo el poder de cómputo de Ethereum. Justo ahora dije que la expansión del poder de cómputo en realidad está poniendo el cálculo en la cadena fuera de la cadena, entonces, ¿cómo se puede realizar la seguridad de Ethereum al mismo tiempo?

Por ejemplo, en el caso de Optimistic Rollup, ¿cómo asegurarse de que alguien pueda desafiar al secuenciador para que haga cosas maliciosas? Es muy importante saber cómo se ve la transacción original específica debajo de la cadena. Si las transacciones originales específicas fuera de la cadena no están disponibles, entonces no puedo encontrar los registros de transacciones originales para cuestionar el secuenciador en la cadena. Por lo tanto, DA puede garantizar la seguridad porque necesita permitir que los metadatos de cada transacción fuera de la cadena estén disponibles en la cadena.

Expandir espacio de bloque

Debido a que todos nuestros datos de transacciones deben cargarse en la cadena, incluso si no se requiere ningún cálculo, aún generaremos grandes datos de transacciones. Entonces, el problema central que tiene que resolver, todos pueden entender que es una tecnología muy efectiva para expandir el espacio de bloques. Si tiene una buena comprensión de la estructura de toda la cadena de bloques, cada bloque contiene una gran cantidad de contenido de transacciones. El bloque en sí de esta transacción, lo llamamos el espacio de bloque.

Actualmente, el espacio de cada bloque en Ethereum es de unos 2.300 KB. Pero tal número obviamente no puede satisfacer las necesidades de la próxima expansión de Ethereum. Aquí se puede hacer un cálculo muy rápido: dividir el espacio de 200 kB por el número de cada transacción es de aproximadamente 100 bytes y obtener el número de 2000 transacciones. Divida 2000 transacciones por el tiempo de bloque de Ethereum 12, lo que significa que el límite superior de TPS de Ethereum está limitado a aproximadamente 100. Bueno, este es en realidad un número muy pequeño para todo el plan de expansión de Ethereum.

Por lo tanto, lo que le importa a Ethereum L2 es cómo garantizar la seguridad y cómo poner una gran cantidad de datos de bloque en el espacio de bloque. Luego, ya sea una prueba de fraude o una prueba de validez, los datos en el espacio de bloque de Ethereum pueden reutilizarse para los controles correspondientes. Finalmente, Ethereum puede garantizar la seguridad de los resultados de los cálculos de las transacciones fuera de la cadena. Así que esta es básicamente la relación entre DA y la seguridad de Ethereum.

Comprenda DA desde la perspectiva del costo del ancho de banda de la red y el costo del almacenamiento

El costo principal de DA tiene dos aspectos, uno se llama el costo del ancho de banda de la red y el otro es el costo del almacenamiento.

En términos de costo de ancho de banda de la red, por ejemplo, en la red P2P, el método actual de transmisión de bloques de Bitcoin y Ethereum es enviar todos los nodos P2P a través de chismes (transmisión) para decirles a todos que tengo un nuevo bloque. La ventaja de este enfoque de red es que es muy seguro y todos los nodos de la red eventualmente recibirán una copia de seguridad.

La desventaja es que tiene una gran sobrecarga en el ancho de banda y la latencia de la red. Sabemos que Ethereum produce un bloque en 12 segundos, después de la actualización del POS. Entonces, si el bloque es demasiado grande y puede demorar más de 12 segundos, no se puede generar una gran cantidad de bloques y, finalmente, todo el ancho de banda de la red caerá a un nivel inaceptable. Entonces, puede pensar en DA como una solución al problema del ancho de banda de una gran cantidad de datos en la cadena de bloques.

Luego, el segundo es su costo de almacenamiento, de hecho, la Fundación Ethereum tiene muchas discusiones sobre este aspecto. En el diseño de la solución central, no permitirá que los datos de bloque cargados por todo el DA se guarden todo el tiempo.

Esto lleva a otra pregunta. Cuando tenga tantos datos en la cadena, pero después de una o dos semanas, será descartado por el protocolo Ethereum. Entonces, en este proceso, ¿tenemos algunas mejores soluciones descentralizadas para guardar estos datos DA?

Esta es también una de nuestras intenciones originales al diseñar EthStorage. Primero, muchos Rollups necesitan guardar datos por un período de tiempo más largo. En el segundo aspecto, con estos datos, puedo usar DA para completar mejor algunas aplicaciones de cadena completa. Por ejemplo, el NFT de toda la cadena, o el front end de muchas DApps, incluyendo incluso una gran cantidad de artículos o comentarios escritos por todo el mundo en las redes sociales. Luego, estos pueden cargarse en toda la cadena de bloques a través de la red DA a un costo menor y pueden obtener la misma seguridad que Ethereum L1.

Esto es después de que investigamos toda la tecnología de Ethereum DA, incluida la discusión con mucho personal central de Ethereum, descubrimos que, en este sentido, Ethereum necesita tener una capa de almacenamiento, y es una capa descentralizada que no necesita ser responsable de Ethereum en sí mismo Una capa de almacenamiento que actualiza el protocolo, o lo que llamamos una capa de almacenamiento modular, para resolver el problema del almacenamiento de datos a largo plazo.

Parte II: Discusión sobre diferentes esquemas DA

La relación entre EIP-4844 y Danksharding, y por qué es necesario implementar EIP-4844

Proto-danksharding también se llama EIP-4844, que creo que puede considerarse como la próxima actualización importante de Ethereum. Hay una razón muy importante por la que se hace 4844. Cuando Ethereum Gene estima la ruta de actualización de la fragmentación de Ethereum, es decir, el tiempo para Danksharding, piensan que todo el tiempo de actualización es bastante largo, por ejemplo, puede tomar tres años para cinco años. Era 2021, 2020.

Luego, en el proceso, predicen que pronto se ejecutará una gran cantidad de Rollup en Ethereum, pero debido a Danksharding, la interfaz de datos que proporciona es completamente diferente de la interfaz de datos de Calldata que utiliza actualmente Rollup. Esto hará que una gran cantidad de aplicaciones de Ethereum no puedan actualizarse rápidamente debido a la nueva interfaz y puedan obtener sin problemas los beneficios que les brinda Danksharding.

Cuando fui a Devcon el año pasado, Vitalik también mencionó que esperaba que Ethereum pudiera servir mejor a estos Capa 2, para que pudieran desarrollar sus contratos mientras usaban la misma interfaz Danksharding. Cuando se actualiza Danksharding, pueden heredar directamente los nuevos beneficios proporcionados por Danksharding sin tener que actualizar sus contratos existentes y probados.

Entonces, EIP-4844 es en realidad una versión súper simplificada de Danksharding, que proporciona la misma interfaz de aplicación que Danksharding, incluido un nuevo código de operación llamado Data Hash y un nuevo objeto de datos llamado Binary Large Objects, que es Blob.

Estos objetos de datos están diseñados para hacer que el resumen sea compatible con la estructura de datos proporcionada por Danksharding por adelantado, es decir, Danksharding proporcionará conceptos similares, como el mismo Data Hash y Blob. Pero a través de EIP-4844, implementaron estas ideas en la próxima actualización de Ethereum por adelantado. Por lo tanto, en toda la función de diseño de EIP-4844, puede ver sus interfaces y, por ejemplo, precompilar y las instrucciones recién agregadas, luego ya puede ver vagamente el futuro de todo Danksharding, cómo aplicarlo en Ethereum Un proceso de interacción de capas.

En este sentido, Ethereum también piensa desde el punto de vista de la aplicación, cómo se pueden realizar algunas actualizaciones por adelantado para permitir que las aplicaciones disfruten mejor de varias tecnologías de expansión en Ethereum, y no hay necesidad de costos de actualización adicionales.

Pero hay un problema que EIP-4844 no resuelve el problema de expandir todo el espacio del bloque, y Danksharding puede resolverlo. El espacio de bloque actual de Ethereum es de aproximadamente 200 KB. Después de Danksharding, el tamaño previsto en la especificación es de 32 megabytes, una mejora de casi 100 veces. Entonces, el EIP-4844 actual en realidad no resuelve el problema del ancho de banda de la cadena de bloques en el bloque.

Cómo Danksharding resuelve el problema de la expansión del espacio de bloques

Bajo el diseño de 4844, durante el proceso de transmisión de los datos en la cadena, todavía usa el mismo método que los datos de llamadas anteriores y transmite a través de la red P2P. Entonces, este método de transmisión eventualmente se verá limitado por el cuello de botella físico de todo el ancho de banda de la red P2P. El método de diseño de Danksharding ha cambiado la transmisión de la red P2P, y luego a través de la tecnología de muestreo de datos, para que todos no necesiten descargar todos los datos del bloque, sino que también sepan que estos datos del bloque se pueden descargar.

De hecho, en cierto sentido, es un poco como el método ZK A través del muestreo de datos, sé que la red contiene (32 megabytes/bloque) bloques de datos traídos por Danksharding. Pero no necesito descargar los 32 megabytes de datos para guardar localmente. Esto también se puede hacer si hay suficiente ancho de banda de la máquina y suficiente rendimiento de espacio de almacenamiento, pero para un verificador ordinario, no necesita descargar los 32 megabytes de datos.

Algo de desarrollo y experiencia de EIP-4844 testnet

Recientemente ejecutamos nuestra red de prueba interna EIP-4844 e implementamos el contrato correspondiente para probar, incluida la carga de datos de blob, la llamada de contrato y la verificación de datos, todos hemos pasado. Entonces, una vez que EIP-4844 esté en línea, podemos implementar nuestros contratos lo antes posible.

Al mismo tiempo, también esperamos que a través de nuestra cooperación actual con algunos desarrolladores de Ethereum, así como algunos de nuestros contratos desarrollados, podamos brindar tiempo para el desarrollo de varios paquetes acumulativos en Ethereum, así como también aprendizaje y diversas herramientas.

Por lo tanto, recientemente enviamos una gran cantidad de código a Ethereum, el conjunto de herramientas para EIP-4844, incluidos nuevos contratos inteligentes para admitir el código de operación, porque la solidez aún no puede admitir el código de operación del hash de datos. Así que todo el trabajo, ya lo estamos sincronizando con algunos desarrolladores de la Fundación Ethereum.

Aplicaciones y limitaciones del Comité de Disponibilidad de Datos (DAC)

Debido a que más del 90 % de los gastos pagados por los usuarios de L2 se pagan por la disponibilidad de los datos, para reducir mejor el costo de la carga de datos, muchos proyectos de L2, incluido ZKSync, lanzaron ZKPorter y Arbitrum Made Arbitrum Nova. Proporcionan su propia capa de datos al proporcionar su propio Comité de disponibilidad de datos DAC.

Este comité de datos traerá algo de confianza adicional para lograr el mismo nivel adicional de seguridad que Ethereum. Por lo tanto, cuando seleccionan el comité de datos, generalmente eligen algunos proveedores de servicios de datos de renombre o empresas de renombre para participar en la preservación de estos datos. Pero, de hecho, habrá muchos desafíos y dudas, porque todos piensan que en realidad esto es una violación del principio de no acceso a la descentralización, lo que significa que todos pueden participar. Pero la situación actual es que la mayoría de los comités de datos son unas pocas organizaciones que están muy cerca del partido del proyecto Layer2.

Al igual que Arbitrum Nova, la última vez que lo miré, probablemente había seis o siete de esos nodos. Por ejemplo, los nodos del comité de datos que se ejecutan en la nube de Google o la nube de Amazon pueden guardar estos datos y pueden proporcionar todos los costos de ejecución en Arbitrum Nova. Una ventaja de esto es que su costo de ejecución actual es aproximadamente una milésima parte del de Ethereum. Porque no necesita escribir todos los datos en la Capa 1 de Ethereum. Pero ahora todavía está relativamente centralizado, por lo que habrá más preocupaciones sobre las aplicaciones de valor relativamente alto, porque si hay una gran cantidad de fondos, decenas de millones o cientos de millones de fondos, entonces debe creer que los datos de la el comité de datos es utilizable.

Entonces, cuando diseñamos EthStorage, en realidad no teníamos ningún concepto de comité de datos. Durante el proceso de diseño, esperamos que todos puedan participar y convertirse en proveedores de datos. Y utilizan pruebas encriptadas para demostrar que efectivamente han almacenado estos datos. Porque en la teoría de este modelo del comité de datos, aunque dije que tengo siete y ocho nodos del comité de datos, de hecho, solo puedo guardar una pieza de datos físicos, pero puedo demostrar que tengo siete u ocho direcciones. proporcionar estos datos.

Luego, cómo probar que tengo suficientes copias físicas de estos datos para garantizar la seguridad de los datos. De hecho, es una innovación muy importante cuando estamos haciendo EthStorage, y también es lo que enfatizamos cuando vamos a predicar al ESP (Programa de Apoyo Ecológico) de la Fundación Ethereum. Utilizamos la tecnología de cifrado ZK utilizada por EthStorage para proteger los nodos proporcionados por los datos de Layer2. Pueden unirse sin permiso y pueden demostrar que tienen tantas copias de almacenamiento y pueden garantizar mejor la seguridad de los datos.

Entonces, creo que DAC es, de hecho, una solución muy temporal al costo de cargar datos en Layer1. Creemos que podemos proporcionar una mejor solución de almacenamiento de datos a través de algunas tecnologías de encriptación de EthStorage, junto con algunos métodos de verificación de pruebas en contratos de Capa 1 basados en Ethereum. A continuación, con el lanzamiento de Ethereum 4844, tomaremos la iniciativa de compartir este contenido innovador y los resultados de su ejecución en la red con usted.

Diferencia entre EthStorage y DAC

EthStorage es en realidad un paquete acumulativo de almacenamiento de Ethereum, un paquete acumulativo de almacenamiento. Entonces podemos asumir que una Capa 2 no es una implementación de Ethereum EVM, sino una base de datos muy grande o una base de datos de valor clave. Puede ser de hasta 10 TB, cientos de TB o incluso miles, que es una base de datos de este tipo a nivel de PB.

Luego, cómo garantizar que los datos en mi base de datos puedan obtener la misma seguridad que Ethereum. En primer lugar, el primer paso es que necesitamos publicar todos estos datos a gran escala en la base de datos en la Capa 1 de Ethereum a través de DA, para que todos puedan ver que estos datos están disponibles en toda la capa DA de Ethereum. Pero no podemos garantizar que se pueda obtener de forma permanente, porque Ethereum DA descartará los datos en unas dos o cuatro semanas.

El segundo paso es después de cargar los datos y luego guardarlos en nuestros nodos de Capa 2. A diferencia de DAC, nuestros nodos de almacenamiento de datos no tienen permiso y cualquiera puede participar. Y prueba su almacenamiento, y luego obtiene la recompensa correspondiente. Este método es a través de un conjunto de mecanismos de prueba de almacenamiento que hemos establecido. Por supuesto, este mecanismo de prueba de almacenamiento también está inspirado en algunos esquemas de diseño de sistemas de prueba de almacenamiento como Filecoin y Arweave. Sin embargo, necesitamos una red y un sistema de prueba para el marco DA de Ethereum y los contratos inteligentes de Ethereum para hacer las pruebas de almacenamiento correspondientes. Entonces, en este sentido, creemos que tenemos una contribución única a toda la ecología de Ethereum, e incluso a todo el almacenamiento descentralizado.

Mecanismo de Comprobante de Almacenamiento

Básicamente, todos los mecanismos de prueba de almacenamiento, incluidos Filecoin y Arweave, primero deben codificar los metadatos del usuario. Pero este proceso de codificación debe codificarse de acuerdo con la dirección del proveedor de datos, es decir, cada proveedor de datos debe tener su propia dirección diferente y luego codificar de acuerdo con su dirección y metadatos para guardar una réplica única (solo copiar) cosas. Por ejemplo, los datos de hola mundo pueden almacenarse en cuatro o cinco máquinas físicas diferentes en una base de datos centralizada tradicional o en un sistema distribuido tradicional, cada uno de los cuales es hola mundo. Pero en EthStorage, ahorra cuatro o cinco o diez o veinte, y su hola mundo se codificará en diferentes datos según la dirección de cada proveedor de datos y luego se almacenará en diferentes lugares.

La ventaja de esto es que podemos usar mecanismos criptográficos para demostrar que hay tantas direcciones diferentes, que son diferentes proveedores de almacenamiento. Codificaron los datos e hicieron las pruebas de almacenamiento correspondientes basadas en los datos codificados. Básicamente, Filecoin y Arweave son similares a esto. Pero son solo para datos estáticos, ahora estamos apuntando a los datos calientes de Ethereum DA. Y se puede verificar a través del contrato inteligente de Ethereum que hay tantas copias físicas de estos datos. Es decir, para cada dato codificado, probaremos que estos datos codificados se almacenan en esta red, y los datos correspondientes a cada dato codificado son diferentes, porque están codificados por las direcciones de diferentes proveedores de almacenamiento.

Básicamente, optimizamos y mejoramos algunas ideas de almacenamiento descentralizado existentes durante el proceso de diseño. Pero al mismo tiempo, también necesitamos optimizar mucho la solución DA de Ethereum, incluida la modificación de datos dinámicos, cómo probar y optimizar de manera efectiva los gastos de gas en los contratos de Ethereum. Por lo tanto, hay muchas tecnologías e investigaciones de vanguardia que deben realizarse.

Cómo EthStorage mantiene Prueba de almacenamiento sin permiso

Hay una especie de nodo en Ethereum llamado nodo de archivo, que guardará los registros históricos de todas las transacciones en Ethereum, incluido el estado del mundo. Pero luego, un gran desafío en Danksharding es que el plan Danksharding generará alrededor de 80 TB de datos al año. Entonces, suponiendo que Ethereum haya estado funcionando durante tres o cuatro años, generará de 200 a 300 TB de datos y seguirá aumentando. Bueno, esto en realidad planteará muchos desafíos para el nodo de archivo, porque en el proceso de ejecución del nodo de archivo, no tiene una economía de fichas adicional para motivar a todos a guardar estos datos.

EthStorage primero debe resolver el problema de los incentivos simbólicos para el almacenamiento permanente de datos. En este sentido, adoptamos el modelo de flujo de efectivo descontado de Arweave para realizar incentivos. Y al mismo tiempo es muy eficiente dejar que se ejecute en todo el contrato inteligente.

El segundo es su enfoque sin permiso. Porque nuestro diseño de incentivos fomenta 10, 50 o incluso 100 nodos para guardar datos en la red. Entonces, para cualquier nodo, puede contactar a cualquiera de ellos, sincronizar los datos correspondientes y luego puede convertirse en una parte de almacenamiento de datos. También puede haber algunos diseños optimizados para más incentivos de datos.

En tercer lugar, debido a que el nodo de almacenamiento necesita guardar todos los datos a la vez, pueden ser cientos de terabytes o incluso un nivel de PB de datos a largo plazo. Entonces, para un solo nodo, el costo es muy alto. Así que hicimos otra cosa llamada fragmentación de datos aquí. De esta manera, para los nodos ordinarios, solo necesita tener un espacio de capacidad de 4 TB (nuestro diseño actual es de 4 TB, por supuesto, puede actualizarse a 8 TB en el futuro), y puede guardar parte del archivado. datos en la red, pero también se utilizan algunos mecanismos de incentivos para garantizar que después de que todos finalmente junten todos estos datos, todos puedan guardarse en nuestra red de capa 2.

Así que hay muchos problemas aquí, como el problema de demasiados datos causados por los nodos de archivo, el problema de los incentivos de los tokens y el problema del acceso descentralizado... Podemos resolver estos problemas a través de Ethereum El contrato inteligente se implementa en la capa 1 para darse cuenta automáticamente. Entonces, para nosotros, solo proporcionamos una red de datos, para que todos puedan descargar datos y generar un certificado de almacenamiento siempre que tengan suficientes costos de datos, enviarlo a la red Ethereum y luego lograr el retorno correspondiente. Básicamente, todo nuestro contrato ha sido diseñado y hemos comenzado a depurar en 4844 Devnet de Ethereum.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)