More Progressive Ways to Measure Deeper Levels of Learning

How do we measure learning beyond knowledge of content? Finding that winning combination of criteria can prove to be a complicated and sometimes difficult process. Schools that are pushing boundaries are learning that it takes time, a lot of conversation, and a willingness to let students participate in that evaluation.

“Most schools and most of our learning stops at knowing and we need to move that and broaden it to the doing and the reflecting,” said Bob Lenz, co-founder & chief executive officer ofEnvision Schools while participating in a Deeper Learning MOOC panel. The charter network’s teachers follow three steps for assessment: know, do, reflect. Skills like critical thinking, problem-solving, and collaboration require practice, Lenz said. Students have to do them constantly and be observed throughout the process for a true assessment.

“The real power comes in the reflective process, both individually and with peers,” Lenz said. “Any of the deeper learning outcomes, the reflection is really where the power is and it puts the onus back on the student, instead of the teacher standing in judgment.” Most projects at Envision schools culminate in an exhibition of work at which students reflect on how they could have done things differently or improved on their work. All four years of high school at Envision are a cycle of performance frameworks feeding into a portfolio and culminating in a defense of four years of learning at which students show what they have learned by demonstrating their knowledge and skill, as well as the ability to learn how to learn.


Teaching rubrics are a common tool in any classroom, but they can easily become a disguised checklist of tasks, instead of a living document designed to structure learning towards a desired skill or outcome. Setting clear goals about what students should know and be able to do when they graduate high school is a good way to start.

“We find it effective to start with the types of student outcomes that we’re after and have all the staff make sense of that, and commit to the common ‘why,’ and then have the instructional practices to reach those outcomes,” said Megan Pacheco, senior director of school design and implementation at the New Tech Network.

Having a rubric doesn’t mean students aren’t engaged in the assessment process or that there’s no room for surprise or creativity. “If those performance tasks are really open ended then students go about them in very unique ways,” Pacheco said. Asking students to dig into the rubric themselves, unpack it, compare themselves against it and reflect on that experience is a great way to get them to understand their own learning.

“Helping students not to think about assessment as just for a grade or the endpoint of learning, but really as that continuing path of development towards all the skills we know they need,” Pacheco said. Students could even be involved in creating the rubric.

“[Students] often don’t like using rubrics that I bring to them,” said Cady Staff, an eighth-grade teacher High Tech Middle Chula Vista. “So when I do use rubrics it would be a co-designed rubric.” Her students reject outside assessments that haven’t been personalized to their classroom and agreed upon by one another. The process of tinkering with the rubric can be on-going. For example, some students at the neighboring high school became interested in gun-violence and started a Kickstarter campaign to raise money to make a documentary about gun violence in their lives. As they worked through their project, they continually changed what elements should be included in the rubric, as they experimented with what would entice people to give to their cause.


In addition to making it clear to students what learning goals will be covered and required of them through the rubric or performance framework, students need constructive feedback in order to improve. But feedback isn’t always appropriate; there are times when it’s very effective and other times when it can be a waste of precious energy.

“Assessment is really time consuming and exhausting,” Staff said. “So when I do it, and give a lot of meaningful feedback, I want to do it at a time that it will help them to improve.” Students don’t want to know how they could have done better after they’ve already turned in the project. Peer assessment is another way for students to gain valuable input on how they can iterate on an idea or project, helping to push towards another, better version.

Assessment can happen as students work to improve their projects. Teachers don’t have to wait until students turn in a final product to know if they are understanding the content, demonstrating their knowledge, working well together, thinking critically through problems that arise and reflecting on their own work. In fact, that’s the only time many of those qualities can actively be assessed since learning happens over time and can’t be capture in just a snapshot. “Strive to help students assess their own deeper learning,” Staff said. When students can reflect on their own learning process to the point of assessing themselves, teachers know they’re learning deeply.


One standardized test that has been praised for its ability to measure critical thinking and creativity is the Programme for International Student Assessment (PISA), an international test that ranks countries in reading, math and science. While those scores give leaders a sense of U.S. students’ international competitiveness in the global market, they don’t give school-based data. A group of educators is trying to capitalize on what is considered to be a fairly effective test, bringing it down to the school level.

“It gives a school a sense of how they are doing on these deeper learning, critical thinking, problem solving skills,” said Peter Kannam, a managing partner with America Achieves tasked with coordinating the OECD Test for Schools. Schools have used the test to identify weaknesses and change course if necessary. One school found that while its students were reading more, they weren’t reading deeply. The school built in more emphasis on reading for enjoyment to engage students.

The drawback with the OECD Test For Schools, as with any assessment that tries to authentically measure soft skills, is that it’s expensive. It costs $11,000 to administer and score the OECD test in each school. “At the end of the day it costs money to grade,” Kannam said. That is typically the drawback with authentic assessment at scale. “We don’t need to necessarily do more assessments, we need to do better assessment,” Kannam said. He pointed out that many assessments currently in use for accountability purposes don’t give educators useful, actionable data at the classroom level.


Some educators are hoping that new assessments meant to test Common Core State Standards will provide more authentic assessment of some deeper learning skills. The Hewlett Foundationhas been supporting work to grow the Deeper Learning Movement and believes that assessment will not only drive teacher practices, but is ultimately the only way to know if schools are succeeding in their efforts.

“We don’t know if we are getting any better unless we can document it,” said Marc Chun, program officer at the Hewlett Foundation. The foundation commissioned a National Center for Research, Evaluation, Standards and Student Testing (CRESST) study to evaluate the Smarter Balanced and PARCC tests for various aspects of deeper learning. The study found that the test actually does measure content and critical thinking better than any other test and it does a reasonable job at measuring written communication.

“Ultimately what we want students to be able to do is solve problems they’ve never seen before,” Chun said. That’s why he thinks even nationally administered tests like those being used to evaluate Common Core standards can be effective. If a classroom is doing incredible project-based work or sending students on interesting and dynamic internships the ultimate test of how much students learned is their ability to transfer that knowledge to a new setting.

While the new tests don’t measure effective oral communication, collaboration, learning how to learn or develop academic mindsets — the other three and a half parts of Hewlett’s definition of deeper learning — there is still a lot of work to be done to effectively scale up well-rounded assessments of deeper learning. But Chun believes the new tests will be a step in the right direction.


Đo lường việc “học sâu” (deep learning) như thế nào?

Có một bài viết cách đây hơn một tháng trên trang Mindshift (Dịch chuyển tư duy) mà theo tôi thì tất cả các giáo viên phổ thông, các nhà sư phạm (đào tạo giáo viên), các chuyên viên về khảo thí của các Sở và Bộ Giáo dục, và cả lãnh đạo ngành giáo dục nữa, đều cần đọc.Đó là bài More progressive ways to measure deeper levels of learning, có thể đọc ở đây:ại sao lại phải đọc bài này? Ai cũng biết là một trong những vấn đề lớn (nan giải!) của giáo dục VN hiện nay là vấn đề học vẹt, mà tiếng Anh gọi là “học cạn” (shallow learning), khiến cho người học luôn rơi vào tình trạng “trả chữ cho thầy” sau khi xong học xong, thi xong và lấy đủ các điểm  số cần thiết để ra trường. Mà nguyên nhân chính, nếu không phải là nguyên nhân duy nhất, của tình trạng này, chính là do cách thi cử quá nhấn mạnh đến kiến thức có được do học thuộc lòng. Vì vậy, muốn thay đổi tình trạng học vẹt thì trước hết phải thay đổi cách thi cử, kiểm tra đánh giá, đó là điều mà Bộ Giáo dục đã ý thức được rất rõ và đang chỉ đạo toàn quốc phải đổi mới.Chỉ có điều, ý thức là một chuyện còn có làm được hay không thì lại là một chuyện khác. Tôi thì tôi cho rằng việc đổi mới thi cử kiểm tra đánh giá ở VN sẽ rất khó khăn và lâu dài, chứ không thể chỉ bằng ý thức của mọi người về việc cần thay đổi, cộng với quyết tâm chính trị và sự chỉ đạo sâu sát vv của Bộ mà có thể xảy ra được. Đơn giản là vì cách thi cử kiểu học thuộc lòng đã quá ăn sâu vào cái văn hoá học đường của VN từ lâu quá rồi, ít nhất là mấy trăm năm nay, từ thời phong kiến khi VN vẫn còn phải học chữ Hán, một loại ngôn ngữ rất khó học và không có cách học nào khác (ít ra là thời gian đầu) hơn là học thuộc lòng – vì rõ ràng là muốn học chữ Hán thì phải viết đi viết lại thuộc lòng từng chữ, có vậy thôi, chứ còn cách nào khác nữa đâu!

Chính vì thiếu kinh nghiệm nên chúng ta cần phải học hỏi của thế giới. Tất nhiên học thì phải hành, nên chưa chắc đọc xong đã làm được, nhưng ít ra nó sẽ giúp ta thay đổi cách nghĩ (mindshift mà!). Vì bài viết bằng tiếng Anh nên có thể khó cho một số người không đọc được trực tiếp, nên tôi giới thiệu lại những ý chính ở đây bằng lời của tôi, kèm những bình luận khi có thể hoặc khi có hứng!

1. Sử dụng rubrics (thang mô tả)

Trước hết, cần giải thích rubrics hay “thang mô tả” trong tiếng Việt. Có thể hiểu về rubrics như thế này: Nó là một thang điểm nhưng không chỉ là những con số lạnh lùng như 3, 5, 8, hoặc 10 thường khiến cho người học thắc mắc (Tại sao bài của em làm tốt như thế này mà chỉ được 5 điểm? Tại sao bạn ấy giống ý của em mà lại được 8, ví dụ thế). Mà kèm theo từng mức điểm là phần giải thích ý nghĩa của số điểm ấy. Ví dụ: 5 điểm = nêu được một số ý chính trong bài; ngôn ngữ diễn đạt có thể hiểu được dù còn khá nhiều lỗi chính tả, ngữ pháp. 8 điểm = nêu trọn vẹn các ý chính trong bài; ngôn ngữ diễn đạt trôi chảy, thuyết phục; có một vài nhận định riêng, độc đáo. Đại khái thế.

Việc sử dụng thang mô tả như trên sẽ giúp cho học sinh rất nhiều, vì họ hiểu được tại sao họ chỉ được 5 chứ không phải là 8 điểm, và còn cần phải tập trung cải thiện những gì nếu muốn đạt điểm cao hơn. Đây là một kỹ thuật trong đánh giá đã được áp dụng rộng rãi ở các nước tiên tiến nhưng chưa được áp dụng tại VN. Tôi hy vọng là đợt cải cách lần này sẽ đưa rubrics vào áp dụng rộng rãi. Tất nhiên có thể cần có nhiều đợt tập huấn, hỗ trợ giáo viên, nhưng đó lại là chuyện khác sẽ không bàn ở đây.

2. Đánh giá khi cần

Ở VN mọi việc thi cử đều có trong kế hoạch định sẵn. Trong vòng bao nhiêu lâu thì phải có điểm 15′, bao lâu thì kiểm tra 1 tiết, rồi thi cuối học kỳ vv. Nhưng như thế chưa đủ. Giáo viên cần phải đánh giá ngay lúc cần thiết, ví dụ sau khi học một bài quá khó và học sinh có vẻ chưa nắm được một số vấn đề để có thể học bài sau đó. Điều này rất cần thiết cho cả thầy lẫn trò, và có tác động trực tiếp đến việc học của học sinh. Nếu bài học khó chưa được nắm vững mà giáo viên cứ đi tiếp thì rõ ràng là sự tiếp thu của học sinh sẽ giảm đi, dẫn đến việc mất căn bản vv, một tình trạng phổ biến ở VN và khiến cho học sinh phải bỏ nhiều thời gian tiền bạc và công sức để đi học thêm.

Tất nhiên để cho giáo viên đánh giá khi cần là việc rất khó làm trong một hệ thống được kiểm soát chặt chẽ như ở VN, đồng thời cũng tạo thêm công việc cho giáo viên vì phải làm thêm những bài test nằm ngoài kế hoạch. Giải pháp: Khuyến khích nhiều bộ sách giáo khoa để giáo viên có thể lựa chọn để làm bài đọc thêm hoặc bài kiểm tra khi cần thiết; và giao thêm quyền tự chủ về chuyên môn đến các trường, bộ môn và giáo viên. (Chắc là không khó, hay là tôi đang lạc quan quá?)

3. Sử dụng PISA ở cấp trường

Đề xuất này chắc là Bộ Giáo dục rất thích đây, vì Bộ cũng đang khuyến khích điều này. Tôi cũng đồng ý, với một điều kiện: Chúng ta hãy xem PISA là một công cụ có thể cung cấp cho chúng ta thông tin THỰC về hiện trạng, chứ đừng xem nó như thành tích cần đạt và vì thế phải chạy theo học, luyện gà vv sao cho đạt được thành tích cao nhất. Nếu chúng ta dùng đúng cách thì PISA có thể có tác động dội ngược phù hợp vì bài test này quả thật có chú trọng đến tư duy phân tích, tổng hợp, phản biện vv của học sinh chứ không chỉ kiến thức sách vở đơn thuần.

4. Sử dụng các hình thức “đánh giá chân thực” (authentic assessment)

Cũng cần định nghĩa authentic assessment mà tôi tạm dịch là đánh giá chân thực. Lấy ví dụ trong ngoại ngữ: nếu ở ngoài đời người ta cần sử dụng tiếng Anh khi đi khám bệnh, mua hàng, đi du lịch, vào khách sạn, nhà hàng, thì trong bài thi cũng sẽ phải có những tình huống tương tự để đạt được “độ chân thực” cao nhất có thể được. Kiểm tra theo cách này không dễ và đặc biệt khó chấm vì có quá nhiều kỹ năng đóng góp cho việc thực hiện thành công một bài thi (không chỉ giỏi tiếng Anh nói chung, mà còn hiểu về bối cảnh ví dụ khi đi vào khách sạn thì sẽ có những thủ tục gì …), nhưng chính hình thức đánh giá chân thực sẽ giúp người học “học sâu” và nhớ lâu vì họ được tham gia vào những hoạt động có ý nghĩa. Cách đánh giá này hình như ở Vn vẫn còn rất hiếm, nếu không kể môn tiếng Anh do ảnh hưởng cách thi cử của nước ngoài.
Bốn lời khuyên nói trên có vẻ rất hợp lý, đúng không các bạn, và cũng có vẻ đơn giản, nhưng chắc chắn là không dễ thực hiện được ở VN, trừ phi có những thay đổi mang tính đột phá ở các cấp quản lý bên trên. Chẳng biết đến bao giờ thì VN có thể thực hiện được 4 lời khuyên ở trên, nhỉ?

