Phân tích Văn học bằng Từ và bằng Số

  • Thread starter Thread starter Butchi
  • Ngày gửi Ngày gửi

Butchi

VPP Sơn Ca
Xu
92
Phân tích Văn học bằng Từ và bằng Số

Patricia Cohen, The New York Times, Đăng ngày 3, tháng 12, 2010. Hiếu Tân dịch



Văn học thời đại Victoria được phân tích bằng thống kê với quy trình mới


Nghiên cứu văn học thời đại Victoria đã hấp dẫn một môn khoa học thống kê mới, bởi vậy những kẻ săn lùng dữ liệu tiên phong này ngày nay đang chủ trương một thí nghiệm khác thường trong khoa phân tích thống kê. Tựa sách của mọi cuốn sách nước Anh xuất bản bằng tiếng Anh trong khoảng thế kỷ 19 - chính xác là 1,681,161 cuốn - đang được lướt bằng phương tiện điện tử để lục tìm những từ khóa những câu khóa có thể cho ta một cái nhìn mới mẻ thấu đáo vào các trí tuệ của thời đại Victoria.

Phương pháp nghiên cứu này mới chỉ bộc lộ những khả năng của nó gần đây, nhờ một thế hệ mới các công cụ kỹ thuật số và các cơ sở dữ liệu cực mạnh, là một trong nhiều cách mà công nghệ đang làm biến đổi khoa nghiên cứu văn học, triết học và các lĩnh vực nhân văn khác vốn chưa ôm nổi việc phân tích cần thiết về số lượng trên quy mô lớn.

Dan Cohen và Fred Gibbs, hai nhà lịch sử khoa học tại đại học George Mason là người đã sáng tạo ra dự án này, đến nay đã lập biểu đồ biểu diễn tần suất của hơn hai chục từ - trong đó có Chúa, tình yêu, công việc, khoa học, công nghiệp - xuất hiện trong các tựa sách từ Cách mạng Pháp 1789 đến đầu Thế chiến Thứ nhất năm 1914. Đối với Cohen, những đường răng cưa sắc nhọn nhảy múa qua các biểu đồ của ông có thể được dùng để khảo nghiệm những niềm tin sâu sắc nhất về những người thuộc thời đại Victoria, giống như niềm tin của họ vào tiến bộ và khoa học. “Chúng tôi cuối cùng đã có thể khảo nghiệm một cách tin cậy những điều khẳng định cơ bản khác nhau đã từng là trung tâm của những công trình nghiên cứu về thời đại Victorra qua nhiều thế hệ.”

Cohen nói rằng ông và Gibbs hy vọng rằng công trình của các ông sẽ được dùng như một kiểu mẫu để các học giả có thể dùng ‘chiếc xe đẩy mua hàng’ của những công cụ kỹ thuật số mới để thử thách các giả thuyết và các cách lý giải đã tồn tại lâu dài trong các khoa học nhân văn.
Một số đồng nghiệp của các ông rõ ràng còn băn khoăn về những khả năng này.
“Phản ứng của riêng tôi là hết sức phấn khởi,” Alice Jenkins giáo sư văn học và văn hóa thời đại Victoria ở trường đại học Glasgow nói, ông đã thấy Cohen trình bày các kết quả ban đầu của mình trong một cuộc hội nghị gần đây về thời đại Victoria.

Tuy nhiên cũng có những lo lắng về tiềm năng của các công cụ điện tử có thể làm giản lược văn học và lịch sử thành một chuỗi các con số, vắt ra những chủ đề quan trọng vốn không dễ dàng định lượng.

“Tôi bị kích động và khiếp hãi” Matthew Bevis một giảng viên đại học York ở Britain nói. Ông cũng có mặt trong cuộc hội nghị nói trên. “Cái này không phải chỉ là một công cụ, nó thật sự đang định hướng loại câu hỏi mà một ai đó trong văn học có thể sẽ hỏi.”
“Nên bỏ nó vào một cái hộp có dán nhãn “xử lý cẩn thận”, ông nói thêm.

Những lo ngại như thế không ngăn cản ông Bevis hay các nhà hàn lâm khác trong cử tọa khỏi yêu cầu ông Cohen vận hành một số công cụ tìm kiếm điện tử các từ đặc biệt thích hợp với lĩnh vực nghiên cứu của riêng họ.

Meredith Martin, một phó giáo sư Anh văn đại học Princeton là người đang nghiên cứu lịch sử hình thức thơ, quan tâm đến các thuật ngữ “vận luật” ,“nhịp điệu” và “thể thơ.”

“Tôi thậm chí đã gửi cho ông ấy một email ngay khi ông ấy đang thuyết trình,” bà Martin nói. Bà hình dung ông đang bị ngập trong đống yêu cầu, và “tôi muốn là người ở hàng đầu.”

Công trình nghiên cứu “bố cục lại thời đại Victoria” của các ông Cohen và Gibbs là một trong 12 dự án đại học đoạt giải thưởng mới về các ngành khoa học nhân văn kỹ thuật số do Google sáng lập, giải thưởng này trao tặng tiền cùng với quyền truy cập vào các máy tính mạnh và các cơ sở dữ liệu của công ty này.

Một số học giả cảnh giác với sự kiểm soát mà một tập đoàn như Google có thể áp dụng đối với thông tin kỹ thuật số. Kế hoạch của Google tạo ra một thư viện và kho lưu trữ khổng lồ trên mạng đã làm dấy lên cảnh báo về tiềm năng độc quyền đối với các sách số hóa có thể kéo theo sự định giá nặng đô.

Nhưng Jon Orwant, giám đốc kỹ thuật của mảng Sách, Tạp chí và Bằng sáng chế của Google, nói kế hoạch đó là để tạo nên những bộ sưu tập và các công cụ tìm kiếm có sẵn miễn phí cho các thư viện và các học giả. “Đó là điều mà chắc chắn chúng tôi sẽ làm, và không, nó không đòi hỏi phải trả gì cả,” ông nói.

Một tiêu chuẩn trong việc lựa chọn các dự án để tài trợ, ông nói thêm, là chúng có tạo ra các tập hợp dữ liệu mới và các mã khóa máy tính mới mà các nhà nghiên cứu khác có thể thấy có ích hay không.

Việc khảo sát các tựa sách của các ông Gibbs và Cohen chỉ là bước đột phá ban đầu vào dữ liệu. Bước thứ hai là rà soát toàn bộ các văn bản. Các giáo sư này cũng sẽ có khả năng nhắm vào các chi tiết, các tựa sách và các đoạn văn đặc biệt.

Điểm xuất phát của họ là một công trình trước đây tập trung vào văn bản như một điểm dẫn nhập vào thời đại này: cuốn “Hệ thống Tư tưởng thời Victoria, 1830-1870” của Walter E. Houghton một tác phẩm cột mốc được xuất bản vào năm 1957 đã tạo nên một thế hệ các học giả, ngay cả khi các kết luận của nó bị nghi ngờ. Houghton tìm cách nắm bắt cái mà ông gọi là “ý nghĩa chung” của tư tưởng của giai tầng trung lưu và thượng lưu thời Victoria, một phần bằng cách đọc kỹ rất nhiều văn bản được viết trong thời đại đó và đếm một cách có phương pháp xem những từ nhất định nào đó xuất hiện bao nhiêu lần. Chẳng hạn, việc dùng nhiều lần các từ như “hy vọng”, “ánh sáng”, “ánh nắng” được hiểu như một dấu hiệu của tinh thần lạc quan đang tăng lên trong thời Victoria.

Danh mục các sách đọc của Houghton là khổng lồ, nhưng phương pháp của ông nêu ra các câu hỏi về căn cứ vững chắc của việc ngoại suy thái độ của hàng triệu người từ vài trăm văn bản.

Hiếu Tần - Văn Chương Việt


 
Phân tích Văn học bằng Từ và bằng Số. 2

Phân tích Văn học bằng Từ và bằng Số. 2

Văn học thời đại Victoria được phân tích bằng thống kê với quy trình mới

PATRICIA COHEN, The New York Times,Đăng ngày 3, tháng 12, 2010,


(Tiếp theo)


Tính toàn diện của những chào mời nghiên cứu lý thuật số dập tắt mọi lời than phiền như vậy. “Toàn bộ lịch sử chỉ là giai thoại.” Cohen nói. “Bạn có thể đã đọc ba cuốn sách và nói văn học thời đại Victoria bị ám ảnh bởi cái ác, hoặc bạn có thể đã đọc 30 cuốn sách hay 300 cuốn, nhưng không thể có chuyện bạn đã đọc 10.000 cuốn sách.”

Nhưng ngày nay, ông giải thích, những thư viện số-hóa khổng lồ giới thiệu “lần đầu tiên khả năng chúng ta có thể tiến hành nghiên cứu toàn diện về văn chương thời Victoria - không chỉ những Mill và những Carlyle danh tiếng, mà mười nghìn tác giả ít được biết đến hơn và thậm chí đã bị lãng quên.”

Các biểu đồ sơ bộ ông trình bày tại cuộc hội nghị phần lớn khẳng định những gì chúng ta đã biết, ông Cohen nói. Khuynh hướng giảm sút nhắc nhở đến “Chúa”, “Cơ đốc”, “vũ trụ” phù hợp với quan niệm thông thường cho rằng thế kỷ 19 là thời kỳ đang lên của chủ nghĩa thế tục và thái độ hoài nghi.

Tuy nhiên các nghiên cứu quy mô cũng thách thức một số lý thuyết được ưa chuộng trong cách đọc kỹ lưỡng, ông nói: chẳng hạn, rằng văn học thời Victoria bị ám ảnh bởi nguồn gốc và bản chất của cái ác. Như nó cho thấy, các cuốn sách mà trong tựa đề có chữ “ác” chen chúc nhau nằm gần dưới đáy biểu đồ, chỉ đếm được 0,1 phần trăm - tức một phần nghìn - số sách xuất bản trong thời Victoria.

Như ông Cohen đã mau mắn thừa nhận, ý nghĩa của những con số này không có gì là rõ ràng. Có thể các tác giả không thích dùng từ “cái ác” trong tựa đề, có lẽ có những từ đồng nghĩa khác thông dụng hơn; cũng có thể ngữ cảnh hướng tới một chủ đề hoàn toàn khác.
Bà Martin ở Princeton biết trực tiếp các công cụ tìm kiếm điện tử có thể khám phá cả những văn bản tối nghĩa lẫn những ngõ cụt như thế nào. Bà đã bỏ ra mười năm biên soạn một danh mục các sách, các bài báo và tạp chí về những khía cạnh kỹ thuật của thi ca.
Bà nhớ lại việc tìm thấy sự bùng nổ đột ngột của các từ “cú pháp” và “vận luật” vào năm 1832, gợi nghĩ đến một cuộc tranh luận sôi nổi về cấu trúc thơ. Nhưng hóa ra “Tiến sĩ Cú pháp và vận luật” là tên của hai chú ngựa đua.

“Bạn tìm thấy 200 tựa sách có từ Syntax (Cú pháp) và bạn nghĩ chắc đây là một cuộc tranh luận lớn về ngữ pháp trong năm đó,” bà Martin nói, “nhưng hóa ra chỉ là con Syntax đã thắng.”


Các học giả cũng nên nhớ rằng quá khứ chứa đựng nhiều hơn những gì được ghi lại, ông Bevis nói trong một cuộc phỏng vấn. Một chủ đề ít được nhắc đến không có nghĩa là nó đã biến mất khỏi văn hóa nhưng thật ra nó đã trở thành một phần máu thịt của cuộc sống và nó không còn gợi hứng cho người ta tranh luận nữa. Ông dẫn lời Emily Dickinson: “Khi sự vật đi qua khỏi trí óc của chúng ta, thì đó là sự lãng quên hay sự thu hút?”


Ông Bevis nói rằng đáng lo ngại hơn là các biện pháp thống kê có thể che mờ ý nghĩa và cách hiểu.

Đừng lo! Những người đang ôm ấp các phương pháp mới nói. Không cần thiết phải thách đấu với máy tính về cách hiểu. Bà Jenkin cho rằng, ngược lại, nghiên cứu về lượng trên quy mô lớn có khả năng làm nổi bật “tầm quan trọng và giá trị của việc đọc lỹ lưỡng; của việc đắm sâu một cách cặn kẽ đầy tưởng tượng vào các từ, các đoạn văn, và các câu thơ.”

“Đọc kỹ lưỡng” bà nói thêm, “sẽ trở nên càng quan trọng hơn trong một thế giới trong đó chúng ta có khả năng tiềm tàng đọc được mọi từ trong văn chương thời Victoria đã từng được xuất bản.”./.


Hiếu Tần - Văn Chương Việt


 

VnKienthuc lúc này

Không có thành viên trực tuyến.

Định hướng

Diễn đàn VnKienthuc.com là nơi thảo luận và chia sẻ về mọi kiến thức hữu ích trong học tập và cuộc sống, khởi nghiệp, kinh doanh,...
Top