Ciencia de datos para la historia: datificar las fuentes para una historia (predictiva)

Autores/as

DOI:

https://doi.org/10.48102/hyg.vi64.541

Palabras clave:

historia, historia digital, datificación, datos, predicción, ciencia de datos

Resumen

La historiografía científica entrelazó tres pilares: documento, dato y hecho. Estos conceptos se revalorizaron con las digitalizaciones masivas a finales del siglo XX, que redefinió el concepto de dato para la historia. Una de las consecuencias fue la pérdida de control de los historiadores sobre los datos, por lo que estos asumieron un doble papel: usuarios de datos digitales o sus curadores. Este cambio supone dos retos: repensar el tratamiento de los datos análogos y digitales; y descubrir cómo aplicar técnicas de la ciencia de datos para enriquecer la práctica histórica. Este artículo examina los cambios producidos por las relaciones entre historia y ciencia de datos, enfocándose en las bases de datos como nuevas narrativas historiográficas. La datificación del pasado es una de las principales consecuencias de la ciencia de datos que, con modelos de inteligencia artificial, convierte en el centro del debate el carácter predictivo de la historia.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Laura Manrique Gómez, Universidad de los Andes, Doctoranda en Historia,

Maestra en Historia de la Pontificia Universidad Javeriana y actualmente doctoranda en Historia de la Universidad de los Andes- Colombia. Ha sido investigadora asistente y profesora de la Maestría de Humanidades Digitales  de la misma universidad y se desempeña Fellow Teacher del Laboratorio de Historia Global de la Universidad de Cambridge. Su investigación principal en curso titulada Historical Ink, se centra en la historia digital, enfatizando la interacción entre metodologías computacionales e históricas utilizando Machine Learning (ML) para estudiar la cultura visual e impresa latinoamericana del siglo XIX. Colabora con el grupo de investigación de Natural Language Processing (NLP) de la Facultad de Ingeniería de la Universidad de los Andes en proyectos que involucran emociones históricas, ironía y detección de cambios semánticos y sesgos. Antes de la academia, Laura lideró proyectos tecnológicos en el sector financiero. Sus calificaciones técnicas incluyen certificaciones en ML, Deep Learning y NLP del Nvidia Deep Learning Institute y la Universidad Nacional de Colombia.

 

 

Jaime Humberto Borja, Universidad de los Andes, Colombia

Doctor en Historia de la Universidad Iberoamericana de Ciudad de México. Suformación  inicialmente estuvo dirigida hacia teoría contemporánea, historiografía, historia cultural medieval y colonial, particularmente la cultura visual. En la actualidad investiga acerca problemas relacionados con  Historia digital y humanidades digitales, particularmente Big Data y Machine Learning aplicadas a la cultura visual colonial. El resultado ha sido la elaboración de contenidos digitales, particularmente una base de datos relacional (ARCA) y un e-book no encapsulado que se desprende de esta investigación. Además de las publicaciones académicas tradicionales de libros y artículos, mis intereses también se desplazan hacia el trabajo museal. Ha sido curador e investigador de varios guiones museográficos permanentes, entre los que se destacan: Museo Nacional (2004), Museo Colonial (2012), Museos de Arte del Banco de la República (2014), Museo de Antioquia (2019), Museo de Arte religioso de Santa fe de Antioquia (2018). Además de varias exposiciones temporales de arte e historia, entre ellas  “Habeas Corpus” (Banco de la República, 2010).  Profesor invitado en la Universidad de Salamanca ( 2002); investigador invitado en la Université Paul Valery Montpellier II (2009); profesor invitado en la Universidad Iberoamericana (CDMX), (2019); y la Universidad de Buenos Aires (2015-2023).Pertenezco a la Red colombiana de Humanidades Digitales y soy miembro de los grupos de investigación “Prácticas Culturales, Imaginarios y Representaciones” y “Retóricas Jesuitas” de la Universidad Iberoamericana de México. 

Citas

Allés Torrent, Susanna. “Sobre la complejidad de los datos en Humanidades o cómo traducir las ideas a datos”. Revista de Humanidades Digitales, no. 4 (2019): 1-28.

Bell, David. Cyberculture Theorists: Manuel Castells and Donna Haraway. Nueva York: Routledge, 2006.

Berry, David. “Digital Humanities: First, Second And Third Wave”. Stun- law philosophy and critique for a digital age, (2011). http://stunlaw.blogs- pot.com/2011/01/digital-humanities-first-second-and.html

Berry, David M. y Fagerjord Anders. Digital Humanities: Knowledge and Critique in a Digital Age. Cambridge: Polity Press, 2017.

Blanke, Tobias. “Predicting the Past”. Digital Humanities Quarterly 12, no. 2 (2018).

Brügger, Niels e Ian Milligan. The Sage Handbook of Web History. Londres: Sage Publications, 2018.

Carr, Eduard. ¿Qué es la historia? Barcelona: Ariel, 1984.

Castells, Manuel. Change. The Impact of the Internet on Society: A Global Perspective., Open Mind bbva, 2014.

Crymble, Adam. Technology and the Historian: Transformations in the Digital Age. Champaign: University of Illinois Press, 2021.

Crymble, Adam y María José Afanador-Llach. Digital History: The Globa- lly Unequal Promise of Digital Tools for History: UK and Colombia’s Case Study. En Teaching History for the Contemporary World, eds. Adele Nye y Jennifer Clark, 85-98. Singapur: Springer. (2021). https://doi. org/10.1007/978-981-16-0247-4_7

Denning, Peter J. y Matti Tedre. Computational Thinking. Cambridge: The Massachusetts Institute of Technology Press, 2019.

Dobson, James. “Interpretable Outputs: Criteria for Machine Learning in the Humanities”. Digital Humanities Quarterly 15, no. 2 (2021). En:https://www.digitalhumanities.org/dhq/vol/15/2/000555/000555.html.

Drucker, Johanna. “Humanities Approaches to Graphical Display”. Digital Humanities Quarterly 5, no. 1 (2011). https://www.digitalhumanities.org//dhq/vol/5/1/000091/000091.html.

Drucker, Johanna. The Digital Humanities Coursebook. An Introduction to Digital Methods for Research and Scholarship. Nueva York: Routledge, 2021.

Economic Commission for Europe of the United Nations (UNECE) Ter- minology on Statistical Metadata. Conference of European Statisticians Statistical Standards and Studies no. 53. Ginebra, 2000.

Flanders, Julia y Fotis Jannidis. The Shape of Data in the Digital Humanities. Nueva York: Routledge, 2019.

Foster, Ian, Rayid Ghani, Ron Jarmin, Frauke Kreuter y Julia Lane. Big Data and Social Science Data Science Methods and Tools for Research and Practice. Londres: CRC Press Taylor & Francis Group, 2021.

Gibbs, Fred y Trevor Owens. “The Hermeneutics of Data and Historical Wri- ting”. En Writing History in the Digital Age, eds. Jack Dougherty y Kristen Nawrotzki, 159-70. Ann Arbor: The University of Michigan Press, 2018. Gitelman, Lisa. Raw Data is an Oxymoron. Cambridge: Massachusetts Institute of Technology Press, 2013.

Graham, Shawn, Ian Milligan y Scott Weingart. Exploring big historical data. The Historian’s Microscope. Londres: Imperial College Press, 2016. Grufstedt, Ylva. Shaping the Past: Counterfactual History and Game Design Practice in Digital Strategy Games. Boston: De Gruyter Oldenbourg,

En: https://doi.org/10.1515/9783110692488

Guldi, Jo. “Scholarly Infrastructure as Critical Argument: Nine principles in a preliminary survey of the bibliographic and critical values expres- sed by scholarly web-portals for visualizing data”. Digital Humanities Quarterly 14, no. 3. (2020) http://digitalhumanities.org:8081/dhq/vol/14/3/000463/000463.html

Guldi, Jo. The Dangerous Art of Text Mining. Cambridge: Cambridge Uni- versity Press, 2023. En: https://doi.org/10.1017/9781009263016

Guldi, Jo y David Armitage. The History Manifesto. Cambridge: Cambridge University Press, 2014.

Hai-Jew, Shalin, ed. Data Analytics in Digital Humanities. Cham: Springer, 2017.

Hayles, Katherine. “Narrative and Database: Natural Symbionts”, PMLA: Publications of the Modern Language Association of America, Special Topic: Remapping Genre 122, no. 5 (octubre, 2007): 1603-8.

Hong, Sun-Ha. “Predictions Without Futures”, History and Theory 61, no.3 (2022): 371-90.

Jiawei, Han, Micheline Kamber y Jian Pei, Data Mining Concepts and Tech- niques. Waltham: Morgan Kaufmann, 1999.

Jones, Steven E. Roberto Busa, S. J. and the Emergence of Humanities Com- puting. The Priest and The Punched Cards. Nueva York: Routledge, 2016.

Kirkpatrick, Keith. “Parallel Computational Thinking”, Communications of the ACM 60, no. 12 (2017): 17–19.

Koby, Mike, Noa Ragonis, Rinat B. Rosenberg-Kima y Orit Hazzan. “Com- putational Thinking in the Era of Data Science”. Communications of the ACM 65, no. 8 (2022): 33-35.

Lavin, Matthew. “Why Digital Humanists Should Emphasize Situated Data over Capta”. Digital Humanities Quarterly 15, no. 2 (2021). En: https:// www.digitalhumanities.org/dhq/vol/15/2/000556/000556.html

Le Deuff, Olivier. Digital Humanities. History and Development. Londres: Wiley, 2018.

Le Goff, Jacques. El orden de la memoria. [1977], Barcelona: Paidós, 1991. Levy, Pierre. Cibercultura. La cultura de la sociedad digital. Barcelona: Anthropos, 2007.

Maciej, Maryl, Costis Dallas, Jennifer Edmond, Ingrida Kelpšienė, Michelle Doran, Marta Kołodziejska y Klaudia Grabowska. “A Case Study Proto- col for Meta-Research into Digital Practices in the Humanities”. Digital Humanities Quarterly 14, no. 3 (2020). En: http://digitalhumanities. org:8081/dhq/vol/14/3/000477/000477.html

Manning, Patrick. Big Data in History. Hampshire: Palgrave MacMillan, 2013.

Manovich, Lev. El lenguaje de los nuevos medios de comunicación. La imagen en la era digital. Barcelona: Paidós, 2005.

Manrique-Gómez, Laura, Tony Montes, Arturo Rodríguez-Herrera y Rubén Manrique. 2024. Historical Ink: 19th Century Latin American Spanish Newspaper Corpus with LLM OCR Correction. En Proceedings of the 4th International Conference on natural Language for Digital Humanities NLP4DH. Miami: Association for Computational Linguistics. https://doi.org/10.48550/arXiv.2407.12838 [En prensa].

Mayer-Schonberger, Viktor y Kenneth Cukier. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Boston: Houghton Mi- fflin Harcourt, 2013.

Melo Flórez, Jairo Antonio. “Historia Digital: La Memoria en el Archivo Infinito”. Historia Crítica 1, no. 43 (2011): 82-103. En: https://doi. org/10.7440/histcrit43.2011.06

Milligan, Ian. History in the Age of Abundance How the Web Is Transforming Historical Research. Montreal: McGill-Queen’s University Press, 2019.

Milligan, Ian. The Transformation of Historical Research in the Digi- tal Age. Cambridge: Cambridge University Press. En: https://doi. org/10.1017/9781009026055

Montes, Tony, Laura Manrique-Gómez y Rubén Manrique. Historical Ink: Semantic Shift Detection for 19th Century Spanish. En: Proceedings of the 5th Workshop on Computational Approaches to Historical Language Change. eds. Nina Tahmasebi, Syrielle Montariol, Andrey Kutuzov, Da- vid Alfter, Francesco Periti, Pierluigi Cassotti y Netta Huebscher, 29-

Bangkok: Association for Computational Linguistics. https://doi. org/10.18653/v1/2024.lchange-1.4

Moretti, FrancoLectura distante. México: Fondo de Cultura Económica, 2013. Morreale, Laura K. 2022. History As Antidote: The Argument For Docu- mentation In Digital History. History and Theory 61, no. 4 (diciembre), 74-66.

Organisation for Economic Co-operation and Development (OECD).OECD Glossary of Statistical Terms. París: OECD Publishing, 2008.

Owens, Trevor. “Defining Data for Humanists: Text, Artifact, Information or Evidence?”, Journal of the Digital Humanities 1, no. 1 (invierno) 2011.

PMLA. Publications of the Language Association of America. 5, Vol. 122, 2007.

Robertson, Stephen. “The Properties Of Digital History”, History and Theory, 61, no. 4 (diciembre 2022): 86-106.

Robertson, Stephen y Lincoln A. Mullen. Arguing with Digital History: Patterns of Historical Interpretation. Journal of Social History 54, no. 4 (verano 2021): 1005-22.

Rojas, Antonio. “Big data en las humanidades digitales. Nuevas conversa- ciones en el contexto académico global”. Anuario ac/e de cultura digital (2017):68-78.

Salmi, Hannu. What is Digital History? Cambridge: Wiley, 2021.

Shilova, Margarita. The Concept of Datafication: Definition and Examples. Data Science Central 2 (junio 2018). https://www.datasciencecentral. com/the-concept-of-datafication-definition-amp-examples/

Schiuma, Giovanni y Daniela Carlucci. Big Data in the Arts and Humanities: Theory and Practice. Boca Ratón: crc Press Taylor & Francis Group, 2018. Schöch, Christof. “Big? Smart? Clean? Messy? Data in the Humanities”, Journal of Digital Humanities 2, no. 3 (Verano 2013).

Schreibman, Susan, Ray Siemens y John Unsworth, eds. A New Companion to Digital Humanities. Chichester: Wiley Blackwell, 2016.

Sinclair, Stéfan y Geoffrey Rockwell. “Text Analysis and Visualization: Ma- king Meaning Count”. En: A New Companion to Digital Humanities., editado por S. Schreibman, R. Siemens, y J. Unsworth, 274–90. Wiley Blackwell, 2016.

Štular, Benjamin y Mateja Belak. “Deep Data Example: Zbiva, Early Me- dieval Data Set for the Eastern Alps”. Research Data Journal for the Humanities and Social Sciences 7, no.1 (2022), 1–13. En: https://doi. org/10.1163/24523666-bja10024

Tanaka, Stefan. “The Old and New of Digital History”, History and Theory 61, no. 4 (diciembre 2022): 3-18.

Torgerson, Jesse W. “Historical Practice in the Era of Digital History”. His- tory and Theory 61, no. 4 (2022): 37–63. En: https://doi.org/10.1111/ hith.12276

Torrent, Susanna Alles. “Sobre la complejidad de los datos en Humanida- des, o cómo traducir las ideas a datos”, Revista de Humanidades Digitales, No. 4 (2019).

Underwood, Ted. “How not to do things with words.” Blog de Ted Un- derwood, Humanista Digital. (25 de agosto de 2012). https://tedun- derwood.com/2012/08/25/how-not-to-do-things-with-words/

Vinale, Adriano. “From History‐writing to (Hi)story‐telling: Historical Novel, Alternate/Counterfactual History and Implicit Uchrony”. His- tory 108, no. 382 (2023a): 407–20. En: https://doi.org/10.1111/1468- 229X.13354

Vinale, Adriano. “(Hi)story‐Telling: An Introduction to Italian Alternate and Counterfactual History”. History 108, no. 382 (2023b): 355–64. En: https://doi.org/10.1111/1468-229X.13355

Viola, Lorella. The Humanities in the Digital: Beyond Critical Digital Humani- ties. Cham: Springer, 2023. https://doi.org/10.1007/978-3-031-16950-2 Wang, Xiaoguang, Qingyu Duan y Mengli Liang. “Understanding the pro- cess of data reuse: An extensive review”. Journal of the Association for In- formation Science and Technology 72, no. 9 (2021): 1161–82. En: https://doi.org/10.1002/asi.24483

Wasielewski, Amanda. Computational Formalism. Art History and Machine Learning. Cambridge: The Massachusetts Institute of Technology Press, 2023.

Wilkinson, Mark D., Michel Dumontier, IJsbrand Jan Aalbersberg, Ga- brielle Appleton, Myles Axton, Arie Baak, Niklas Blomberg, et al. “The FAIR Guiding Principles for scientific data management and stewards- hip”. Scientific Data 3, no. 1 (marzo 2016), 160018. En: https://doi. org/10.1038/sdata.2016.18

Wing, Jeannette. “Computational thinking and thinking about compu- ting”. Philosophical Transactions of the Royal Society A Mathematical, Phy- sical and Engineering Sciences 366: (2008), 3717–25.

Zaagsma, Gerben. “Digital History and the Politics of Digitization”. Digital Scholarship in the Humanities 38, 2 (junio 2023): 830–51. https://doi. org/10.1093/llc/fqac050

Zoltán, Simon Boldizsár y Marek Tamm. History and Theory 60, no. 1 (2021): 3-22.

Descargas

Publicado

2024-12-29

Cómo citar

Manrique Gómez, Laura, y Jaime Humberto Borja. 2024. «Ciencia De Datos Para La Historia: Datificar Las Fuentes Para Una Historia (predictiva)». Historia Y Grafía, n.º 64 (diciembre):97-145. https://doi.org/10.48102/hyg.vi64.541.

Artículos más leídos del mismo autor/a