Content Similarity Scorer Example

This example demonstrates how to use Mastra's Content Similarity Scorer to evaluate the textual similarity between input and output content.

Prerequisites

Clone the repository and navigate to the project directory:

bash

git clone https://github.com/mastra-ai/mastra
cd examples/basics/scorers/content-similarity

The Content Similarity Scorer evaluates textual similarity between input and output content using various similarity metrics. It measures:

The example includes three scenarios:

High Similarity: Testing minimal text variations (tense changes, articles)
Moderate Similarity: Testing rephrased content with similar meaning but different wording
Low Similarity: Testing completely different content with minimal overlap

Each scenario demonstrates:

The example will output:

The input and output text for each scenario
The scorer result with:
- Score (0-1, where 1 indicates identical content)
- Extract step results showing detailed similarity metrics

createContentSimilarityScorer: Function that creates the content similarity scorer instance
No configuration required - the scorer uses built-in similarity algorithms
scorer.run(): Method to evaluate input/output pairs for content similarity
- Takes { input, output } where:
  - input: Array of chat messages (e.g., [{ role: 'user', content: 'text' }])
  - output: Response object (e.g., { role: 'assistant', text: 'response' })
- Returns results with:
  - score: Numerical similarity score (0-1)