Ciencia en tus manos

La aventura en la nube de la Biblioteca del Congreso

No hay comentarios Share:

Judith Conklin, CIO de la Biblioteca del Congreso, habla sobre la migración a la nube y la digitalización en curso de la biblioteca federal más antigua del país. Un proyecto a gran escala destinado a poner a disposición de todos más de sus 170 millones de activos.

La CIO Judith Conklin tiene un gran trabajo: migrar la biblioteca más grande del mundo a la nube. Judith Conklin, CIO ascendida de la Biblioteca del Congreso en septiembre tras la jubilación del ex CIO Bernard Barton, dirigió la transformación digital de la Biblioteca del Congreso (LOC) durante cinco años. Por lo tanto, la institución debe migrar millones de libros, colecciones históricas y documentos del Congreso a un complejo entorno de nube híbrida. Este enfoque forma parte de un plan estratégico de TI lanzado en 2019 destinado a digitalizar y poner a disposición del público, desde cualquier dispositivo, gran parte de los más de 170 millones de activos físicos del LOC. .

“A medida que el mundo editorial y el mundo de las bibliotecas en general se vuelven más digitales, también lo hace la Biblioteca del Congreso”, dice Judith Conklin, quien supervisa aproximadamente 400 empleados en ISD, incluidos aproximadamente 200 contratistas. La Biblioteca del Congreso, que se encuentra en tres edificios en el Capitolio, los edificios Madison, Adams y Jefferson, continuamente “ingiere” nuevos datos y metadatos físicos y digitales. Aunque el objetivo no es digitalizar el 100% de sus documentos, la transformación sigue siendo grande y compleja, según Conklin. “Hay datos que mantendremos en su lugar y algunos en la nube para aprovechar la eficiencia y la elasticidad”, agrega.

George Westerman, investigador principal y profesor titular de la Sloan School of Management del MIT, cree que este ambicioso proyecto beneficiará a la sociedad en su conjunto. “Es impresionante ver cómo el COL busca digitalmente ‘abrir un cofre del tesoro’ para que los diversos artefactos de la biblioteca estén disponibles para ciudadanos, educadores e innovadores de todo el país sin salir de la biblioteca. «Tienen que ir a Washington», dice Westerman.

Una transformación radical

LOC inicialmente pidió a Accenture que ayudara a planificar la transformación de su centro de datos, que ahora está completo. Este esfuerzo de tres años consistió en trasladar más de 130 sistemas informáticos y aplicaciones de la biblioteca de un centro de datos de centro de datos «obsoleto» ubicado en el edificio Madison a un centro de datos de nivel III de última generación ubicado en las afueras de Washington. , DC, así como a otros centros de datos y servicios en la nube administrados por la biblioteca y conectados a través de una WAN de múltiples rutas.

Con este entorno de nube corporativa en su lugar, la biblioteca ahora se centra en el Enterprise Copyright System (ECS) para la Oficina de Copyright, el Integrated Research and Information System (IRIS) para el Congressional Research Service (CRS) y en varios proyectos para mejorar la forma en que la biblioteca acepta, gestiona y entrega material de colecciones, incluido un sistema de gestión de contenidos audiovisuales y una nueva plataforma de contenidos bibliotecarios. El proyecto ECS, que asignó datos de derechos de autor a uno de los principales proveedores de la nube, hará que el proceso de solicitud de derechos de autor sea más fácil y transparente. “Cada vez más personas quieren registrar sus materiales con derechos de autor”, dice Judith Conklin, lo que la convierte en una candidata principal para la escala y la eficiencia de la nube.

Judith Conklin fue ascendida a CIO de la Biblioteca del Congreso en septiembre de 2021 (Crédito de la foto: Biblioteca del Congreso)

La Oficina de Copyright de EE. UU., Que tiene varias divisiones que incluyen recomendaciones de licencias y registros públicos, se basa en una combinación de procesos manuales y automatizados por sistemas informáticos que deben modernizarse. El Congreso ha asignado $ 60 millones para esta tarea y la biblioteca tiene una «fecha límite muy estricta» para su finalización, dice ISD. Se espera que el sistema esté operativo en octubre de 2024. Reorganizando los procedimientos de gestión de proyectos de la biblioteca para la era digital, este CIO también se ha embarcado en un plan de almacenamiento digital de cinco años, que incluye la «ingestión» o la absorción de los muchos «nacidos digitales». ”Colecciones que llegan a la biblioteca en formato digital de diversas fuentes, así como contenidos digitalizados de ambas Cámaras del Congreso.

Un presupuesto que bloquea

La biblioteca ha almacenado datos digitalizados durante décadas en sistemas tradicionales, incluidos muchos documentos y colecciones históricos importantes. Algunos documentos digitalizados permanecerán en su lugar y no todos serán accesibles al público. “El objetivo no es digitalizar el 100% de nuestras colecciones, lo que atrae a algunos”, dice Conklin, quien señala que el presupuesto de la biblioteca no permite un almacén de datos digital infinito, aunque señala que el Congreso está suavizando su postura al hacer más datos públicos tras la aprobación de una ley hace dos años.

La Constitución de los Estados Unidos, por ejemplo, no se publicará en el sitio web de la Biblioteca del Congreso, dice Conklin. Sin embargo, “la transformación digital de la biblioteca tuvo un impacto en nuestra comprensión de la Constitución, ya que un curador interno utilizó el análisis espectral de una versión digitalizada de la Constitución para descubrir cambios que no se habían descubierto antes. «. Analizaron este proyecto de Constitución capa por capa y dicen que encontraron cambios … a la Constitución que no se conocían», agrega, comparando este hallazgo con la activación retroactiva de los cambios en la Constitución.

Un paso hacia la IA

La biblioteca también está interesada en tecnologías experimentales de inteligencia artificial como visión por computadora, aprendizaje automático y aplicaciones enfocadas en clips de sonido y artes visuales, la mayoría de las cuales están disponibles como software de código abierto. Dado que los datos y metadatos que llegan a la Biblioteca del Congreso son infinitos, el trabajo de transformación digital nunca estará realmente terminado. «Es la lucha de todos los CIO», dice Judith Conklin. Pero no hay duda de que esta biblioteca nacional está a años luz de donde estaba cuando inició su transformación digital.

También te puede gustar