Las primeras referencias al romance andalusí se conocen por las alusiones a su lengua latina de los andalusíes. Por ejemplo, motes o palabras sueltas que intercalaban en los textos en árabe. No sólo estos textos proporcionaban léxico, sino que hay narraciones sobre cómo determinados personajes hablaban en romance. Especialmente llamativo es el caso del botánico Ibn Buqlaris señalando el nombre de determinadas plantas en todas las lenguas del Al-Ándalus: árabe clásico, latín, aljamía (romance) y árabe andalusí, siendo éste el primer idioma al que se le llamó español (isbaniyyah), siglos antes que al castellano.

Afortunadamente, los andalusíes fueron bastante proclives a redactar glosarios (especialmente médicos y botánicos) en los que añadían el nombre romance en muchas ocasiones. El principal es el glosario del botánico sevillano Abuljair, que en época almohade se recorrió el territorio de Al-Ándalus censando todas las plantas que pudo. Si había un sinónimo en romance, lo recogía y especificaba si esa palabra era un localismo o si se decía así en toda la Hispania musulmana. Además del glosario de Abuljair, destacan los del Vocabulista atribuído a Ramón Martí (Dialecto valenciano) y el Vocabulista en arábico de Pedro de Alcalá, que recoge romancismos del árabe en época nazarí.

Página del Vocabulista en arábico de Pedro de Alcalá

 

El glosario de Leiden, pese al escaso número de romancismos, los escribe en alfabeto latino, siendo uno de los pocos ejemplos en los que no se usó los alfabetos semíticos.

El cordobés Ibn Quzmán en su moaxaca intercaló palabras e incluso frases completas en romance. Palabras como "esbayidu" (asustado), "poren" (para) o "bastitu" (honrado) sólo se han documentado en él.

También hay mucha toponimia andalusí en romance. Quizá la más reseñable es la de la ciudad de Madrid, cuyo origen es la palabra romance matrich(i): Matriz o manantial.

El primer estudio sobre esta lengua, con todo el vocabulario que se conocía en ese momento, lo publica Francisco Javier Simonet en 1888: Glosario de voces ibericas y latinas usadas entre los mozarabes precedido de un estudio sobre el dialecto hispano-mozárabe.

Aunque dista mucho de ser un estudio filológico con los estándares que hoy aceptaríamos, sigue siendo el libro de cabecera y piedra angular de todo lo que se ha publicado posteriormente sobre esta lengua.

Simonet consideraba que esta lengua era la modalidad del castellano en Al-Andalus y que esto era una demostración de que la "raza hispánica" subyugada a la invasión sarracena (sic) fue capaz de sobrevivir en territorio musulmán. Menéndez Pidal en Orígenes del español mantenía esta idea de que no era una lengua aparte.

En 1948, el hebraísta Miklos Stern publicó las 24 primeras jarchas escritas en alfabeto hebreo y recién descubiertas en  su famoso artículo «Les vers finaux en espagnol dans les muwasshas hispano-hébraiques: Une contribution à l'histoire du muwassahas et à l'etude du vieux dialecte espagnol 'mozarabe'», Aunque seguía considerando que era un dialecto del castellano. Estas jarchas eran primera lírica en romance de toda la historia.

En 1965, García Gómez publicó Las jarchas romances de la serie árabe en su marco, con las 60 jarchas de la serie árabe.

Jarcha de la serie árabe

No sólo hay fuentes en el territorrio andalusí. En el Toledo recién conquistado se ha documentado romandalusismos en documentos notariales y algo aún más llamativo: "errores" de los antiguos andalusíes y recién castellanos al escribir en la nueva lengua. Así, hemos podido confirmar la -u final (escribieron sobrinu en vez de sobrino), la "y" para deshacer el hiato (reyal, mayestru) y el artículo masculino plural les. En Toledo hay documentos notariales en árabe, pero con un importante número de palabras de origen romance.

Por último, la propia lengua árabe andalusí tomó prestado un gran número de palabras de origen romance. En algunos casos la palabra romance original no se documenta, pero sí el arabismo. Por ejemplo, la palabra ada ("también", del latín ad hanc o ad haec) se documenta porque los andalusíes la adoptaron al árabe, no porque aparezca en un texto latino.