Replace .include with #includefix-include

For some reason, both mipsel-unknown-elf-gcc 8.2.0 and mipsel-non-elf 15.1.0 were unable to resolve .include assembler directives. As a workaround, it is still possible to use the preprocessor, and therefore the usual #include preprocessor directive. However, this requires the assembly files to use the uppercase .S file extension.
author: Xavier Del Campo Romero <xavi92@disroot.org> 2025-07-05 02:34:11 +0200
committer: Xavier Del Campo Romero <xavi92@disroot.org> 2025-07-05 02:34:11 +0200
commit: beb76e4dd362374b8f42cd971d394bba1074cd8d (patch)
tree: 3ea4cc342737afb9225c01160c92647ba66c78bd /libpsn00b/smd/smd_cel.S
parent: 5d9aa2d3dfc7d6e51c2eb942ab4cdbae5571a40a (diff)
download: psn00bsdk-fix-include.tar.gz
1 files changed, 1078 insertions, 0 deletions
diff --git a/libpsn00b/smd/smd_cel.S b/libpsn00b/smd/smd_cel.S
new file mode 100644
index 0000000..e8cf911
--- /dev/null
+++ b/libpsn00b/smd/smd_cel.S
@@ -0,0 +1,1078 @@
+# PSn00bSDK .SMD model parser library
+# (C) 2019-2023 Lameguy64, spicyjpeg - MPL licensed
+
+.set noreorder
+
+#include "gtereg.inc"
+#include "inline_s.inc"
+#include "smd/smd_s.inc"
+
+.section .text.smdSetCelTex, "ax", @progbits
+.global smdSetCelTex
+.type smdSetCelTex, @function
+
+smdSetCelTex:
+	# a0 - TPage value
+	# a1 - CLUT value
+	la		$v0, _smd_cel_tpage
+	andi	$a0, 0xffff
+	sll		$a1, 16
+	or		$a0, $a1
+	jr		$ra
+	sw		$a0, 0($v0)
+
+.section .text.smdSetCelParam, "ax", @progbits
+.global smdSetCelParam
+.type smdSetCelParam, @function
+
+smdSetCelParam:
+	# a0 - Shading texture U offset
+	# a1 - Shading texture V offset
+	# a2 - Shading primitive color
+	andi	$a1, 0xff
+	sll		$a1, 8
+	andi	$a0, 0xff
+	or		$a0, $a1
+	la		$v0, _smd_cel_param
+	sw		$a0, 0($v0)
+	la		$v0, _smd_cel_col
+	lui		$v1, 0x0200
+	or		$a3, $v1
+	jr		$ra
+	sw		$a2, 0($v0)
+
+.section .text.smdSortModelCel, "ax", @progbits
+.global smdSortModelCel
+.type smdSortModelCel, @function
+
+smdSortModelCel:
+	# a0 - Pointer SC_OT structure
+	# a1 - Pointer to next primitive
+	# a2 - Pointer to SMD data address
+	# v0 - New pointer of primitive buffer (return)
+
+	addiu	$sp, -16
+	sw		$s0, 0($sp)
+	sw		$s1, 4($sp)
+	sw		$s2, 8($sp)
+	sw		$s3, 12($sp)
+
+	la		$v0, _sc_clip
+	lw		$t8, 0($v0)
+	lw		$t9, 4($v0)
+
+	lw		$t0, OT_LEN($a0)
+	lw		$a0, OT_ADDR($a0)
+	lw		$t1, SMD_HEAD_PVERTS($a2)
+	lw		$t2, SMD_HEAD_PNORMS($a2)
+	lw		$t3, SMD_HEAD_PPRIMS($a2)
+
+.sort_loop:
+
+	nop
+	lw		$a3, 0($t3)				# Get primitive ID word
+	move	$t4, $t3
+
+	beqz	$a3, .exit				# Check if terminator (just zero)
+	addiu	$t4, 4
+
+	lhu		$t5, 0( $t4 )			# Load vertices
+	lhu		$t6, 2( $t4 )
+	lhu		$t7, 4( $t4 )
+	sll		$t5, 3
+	sll		$t6, 3
+	sll		$t7, 3
+	addu	$t5, $t1
+	addu	$t6, $t1
+	addu	$t7, $t1
+	lwc2	C2_VXY0, 0( $t5 )
+	lwc2	C2_VZ0 , 4( $t5 )
+	lwc2	C2_VXY1, 0( $t6 )
+	lwc2	C2_VZ1 , 4( $t6 )
+	lwc2	C2_VXY2, 0( $t7 )
+	lwc2	C2_VZ2 , 4( $t7 )
+
+	srl		$v1, $a3, 24			# Get primitive size
+	addu	$t3, $v1				# Step main pointer to next primitive
+
+	RTPT
+
+	cfc2	$v0, C2_FLAG			# Get GTE flag value
+	nop
+
+	bltz	$v0, .skip_prim			# Skip primitive if Z overflow
+	andi	$v0, $a3, 0x3
+
+	NCLIP							# Backface culling
+
+	srl		$v1, $a3, 12
+	andi	$v1, 1
+
+	bnez	$v1, .no_culling
+	nop
+
+	mfc2	$v1, C2_MAC0
+	nop
+	bltz	$v1, .skip_prim
+	nop
+
+.no_culling:
+
+	beq		$v0, 0x1, .prim_tri		# If primitive is a triangle
+	nop
+	beq		$v0, 0x2, .prim_quad	# If primitive is a quad
+	nop
+
+	b		.skip_prim
+	nop
+
+## Triangles
+
+.prim_tri:							# Triangle processing
+
+	addiu	$t4, 8					# Advance from indices
+
+	AVSZ3							# Calculate average Z
+
+	srl		$v0, $t0, 16			# Get Z divisor from OT_LEN value
+	andi	$v0, 0xff
+
+	mfc2	$t5, C2_OTZ				# Get AVSZ3 result
+
+	sra		$v1, $t0, 24			# Get Z offset from OT_LEN value
+
+	srl		$t5, $v0				# Apply divisor and offset
+	sub		$t5, $v1
+
+	blez	$t5, .skip_prim			# Skip primitive if less than zero
+	andi	$v1, $t0, 0xffff
+	bge		$t5, $v1, .skip_prim	# Skip primitive if greater than OT length
+	sll		$t5, 2
+	addu	$t5, $a0				# Append OTZ to OT address
+
+	ClipTestTri
+
+	and		$v0, $s0, $s1			# v0 & v1
+	beqz	$v0, .do_draw
+	and		$v0, $s1, $s2			# v1 & v2
+	beqz	$v0, .do_draw
+	and		$v0, $s2, $s0			# v2 & v0
+	beqz	$v0, .do_draw
+	nop
+	b		.skip_prim
+	nop
+
+.do_draw:
+
+
+	srl		$v0, $a3, 2					# Lighting enabled?
+	andi	$v0, 0x3
+	bnez	$v0, .F3_light
+	nop
+
+	andi	$v0, $a3, 0x10				# Gouraud shaded
+	bnez	$v0, .F3_gouraud
+	nop
+
+	andi	$v0, $a3, 0x20				# Textured triangle
+	bnez	$v0, .F3_textured
+	nop
+
+	lw		$v0, 0( $t4 )				# Flat color, no lighting
+	lui		$v1, 0x2000
+	or		$v0, $v1
+
+	b		.sort_F3_pri
+	sw		$v0, POLYF3_rgbc( $a1 )
+
+.F3_gouraud:
+
+	lw		$v0, 0($t4)
+	lw		$v1, 4($t4)
+	.set noat
+	lui		$at, 0x3000
+	or		$v0, $at
+	.set at
+	sw		$v0, POLYG3_rgbc0($a1)
+	lw		$v0, 8($t4)
+	sw		$v1, POLYG3_rgbc1($a1)
+	b		.sort_G3_pri
+	sw		$v0, POLYG3_rgbc2($a1)
+
+.F3_textured:
+
+	lw		$v0, 0( $t4 )				# Flat color, no lighting
+	lui		$v1, 0x2400
+	or		$v0, $v1
+	sw		$v0, POLYFT3_rgbc( $a1 )
+	addiu	$t4, 4
+
+	lhu		$v0, 0( $t4 )				# Load texture coordinates
+	lhu		$v1, 2( $t4 )
+	sh		$v0, POLYFT3_uv0( $a1 )
+	lhu		$v0, 4( $t4 )
+	sh		$v1, POLYFT3_uv1( $a1 )
+	sh		$v0, POLYFT3_uv2( $a1 )
+
+	lw		$v0, 8( $t4 )				# Tpage + CLUT
+	nop
+	andi	$v1, $v0, 0xffff
+	sh		$v1, POLYFT3_tpage( $a1 )
+	srl		$v0, 16
+
+	b		.sort_FT3_pri
+	sh		$v0, POLYFT3_clut( $a1 )
+
+.F3_light:
+
+	lhu		$v0, 0( $t4 )				# Load normal 0
+
+	srl		$v1, $a3, 2
+	andi	$v1, $v1, 0x3
+
+	sll		$v0, 3
+	addu	$v0, $t2
+	lwc2	C2_VXY0, 0( $v0 )
+	lwc2	C2_VZ0 , 4( $v0 )
+
+	beq		$v1, 0x2, .F3_light_smt
+	nop
+
+	lw		$v0, 4( $t4 )
+	lui		$v1, 0x2000
+	or		$v0, $v1
+	mtc2	$v0, C2_RGB
+
+	addiu	$t4, 8
+	nop
+
+	NCCS
+
+	andi	$v0, $a3, 0x20				# Textured triangle
+	bnez	$v0, .F3_light_tex
+	nop
+
+	swc2	C2_RGB2, POLYF3_rgbc( $a1 )
+
+	b		.sort_F3_pri
+	nop
+
+.F3_light_tex:
+
+	lhu		$v0, 0( $t4 )				# Load texture coordinates
+	lhu		$v1, 2( $t4 )
+	sh		$v0, POLYFT3_uv0( $a1 )
+	lhu		$v0, 4( $t4 )
+	sh		$v1, POLYFT3_uv1( $a1 )
+	sh		$v0, POLYFT3_uv2( $a1 )
+
+	lw		$v1, 8( $t4 )
+	nop
+	andi	$v0, $v1, 0xffff
+	sh		$v0, POLYFT3_tpage( $a1 )
+	srl		$v0, $v1, 16
+	sh		$v0, POLYFT3_clut( $a1 )
+
+	mfc2	$v0, C2_RGB2
+	lui		$v1, 0x2400
+	or		$v0, $v1
+
+	b		.sort_FT3_pri
+	sw		$v0, POLYFT3_rgbc( $a1 )
+
+.F3_light_smt:
+
+	lhu		$v0, 2($t4)			# Load normals 1 and 2
+	lhu		$v1, 4($t4)
+	sll		$v0, 3
+	sll		$v1, 3
+	addu	$v0, $t2
+	addu	$v1, $t2
+	lwc2	C2_VXY1, 0($v0)
+	lwc2	C2_VZ1 , 4($v0)
+	#la		$v0, _smd_cel_col
+	#lw		$v0, 0($v0)
+	lwc2	C2_VXY2, 0($v1)
+	lwc2	C2_VZ2 , 4($v1)
+	mtc2	$v0, C2_RGB
+
+	swc2	C2_SXY0, POLYFT3_xy0($a1)
+	swc2	C2_SXY1, POLYFT3_xy1($a1)
+	swc2	C2_SXY2, POLYFT3_xy2($a1)
+
+	la		$v0, _smd_cel_tpage		# Load cel shader TPage and CLUT values
+	lw		$v0, 0($v0)
+
+	NCT
+
+	andi	$v1, $v0, 0xffff
+	sh		$v1, POLYFT3_tpage($a1)
+	srl		$v1, $v0, 16
+	sh		$v1, POLYFT3_clut($a1)
+
+	# Usable regs: v0, v1, at, t6, t7
+
+	.set noat
+
+	la		$at, _smd_cel_param			# Load cel shader parameters
+	lhu		$at, 0($at)
+
+	mfc2	$t7, C2_RGB0				# Get first shaded color
+	andi	$v1, $at, 0xff				# Get U divisor value
+	andi	$t7, 0xffff					# Only keep R and G colors
+
+	andi	$v0, $t7, 0xff				# U0
+	srl		$v0, $v1
+	sb		$v0, POLYFT3_uv0($a1)
+	srl		$v0, $t7, 8					# V0
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT3_uv0+1($a1)
+
+	mfc2	$t7, C2_RGB1
+	andi	$v1, $at, 0xff
+	andi	$t7, 0xffff
+	andi	$v0, $t7, 0xff				# U1
+	srl		$v0, $v1
+	sb		$v0, POLYFT3_uv1($a1)
+	srl		$v0, $t7, 8					# V1
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT3_uv1+1($a1)
+
+	mfc2	$t7, C2_RGB2
+	andi	$v1, $at, 0xff
+	andi	$t7, 0xffff
+	andi	$v0, $t7, 0xff				# U2
+	srl		$v0, $v1
+	sb		$v0, POLYFT3_uv2($a1)
+	srl		$v0, $t7, 8					# V2
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT3_uv2+1($a1)
+
+	la		$v0, _smd_cel_col
+	lw		$v0, 0($v0)
+	lui		$v1, 0x2600
+	or		$v0, $v1
+	sw		$v0, POLYFT3_rgbc($a1)
+
+	lw		$t7, 8($t4)
+	addiu	$t4, 12
+
+	lui		$v1, 0x0700
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$v1, $a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $v1
+	sw		$v0, 0($t5)
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+	addiu	$a1, POLYFT3_len
+
+	.set at
+
+	andi	$v0, $a3, 0x20				# Textured triangle
+	bnez	$v0, .F3_light_tex_smt
+	nop
+
+	#swc2	C2_RGB0, POLYG3_rgbc0( $a1 )
+	#swc2	C2_RGB1, POLYG3_rgbc1( $a1 )
+	#swc2	C2_RGB2, POLYG3_rgbc2( $a1 )
+
+	lui		$v0, 0x2000
+	or		$t7, $v0
+	b		.sort_F3_pri
+	sw		$t7, POLYF3_rgbc($a1)
+
+.F3_light_tex_smt:
+
+	lhu		$v0, 0( $t4 )				# Load texture coordinates
+	lhu		$v1, 2( $t4 )
+	sh		$v0, POLYFT3_uv0( $a1 )
+	lhu		$v0, 4( $t4 )
+	sh		$v1, POLYFT3_uv1( $a1 )
+	sh		$v0, POLYFT3_uv2( $a1 )
+
+	lw		$v1, 8( $t4 )
+	nop
+	andi	$v0, $v1, 0xffff
+	sh		$v0, POLYFT3_tpage( $a1 )
+	srl		$v0, $v1, 16
+	sh		$v0, POLYFT3_clut( $a1 )
+
+	lui		$v1, 0x2400
+	or		$t7, $v1
+
+	b		.sort_FT3_pri
+	sw		$t7, POLYFT3_rgbc( $a1 )
+
+.sort_F3_pri:
+
+	swc2	C2_SXY0, POLYF3_xy0($a1)
+	swc2	C2_SXY1, POLYF3_xy1($a1)
+	swc2	C2_SXY2, POLYF3_xy2($a1)
+
+	la		$v0, _smd_tpage_base
+	lhu		$v0, 0($v0)
+	srl		$v1, $a3, 6				# Get blend mode
+	andi	$v1, 0x3
+	sll		$v1, 5
+	or		$v0, $v1
+	lui		$v1, 0xe100
+	or		$v0, $v1
+	sw		$v0, POLYF3_tpage($a1)	# Store TPage
+
+	.set noat
+
+	lui		$v1, 0x0500
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYF3_len
+
+.sort_FT3_pri:
+
+	swc2	C2_SXY0, POLYFT3_xy0( $a1 )
+	swc2	C2_SXY1, POLYFT3_xy1( $a1 )
+	swc2	C2_SXY2, POLYFT3_xy2( $a1 )
+
+	.set noat
+
+	lui		$v1, 0x0700
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYFT3_len
+
+.sort_G3_pri:
+
+	swc2	C2_SXY0, POLYG3_xy0( $a1 )
+	swc2	C2_SXY1, POLYG3_xy1( $a1 )
+	swc2	C2_SXY2, POLYG3_xy2( $a1 )
+
+	la		$v0, _smd_tpage_base
+	lhu		$v0, 0($v0)
+	srl		$v1, $a3, 6				# Get blend mode
+	andi	$v1, 0x3
+	sll		$v1, 5
+	or		$v0, $v1
+	lui		$v1, 0xe100
+	or		$v0, $v1
+	sw		$v0, POLYG3_tpage($a1)	# Store TPage
+
+	.set noat
+
+	lui		$v1, 0x0700
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYG3_len
+
+.sort_GT3_pri:
+
+	swc2	C2_SXY0, POLYGT3_xy0( $a1 )
+	swc2	C2_SXY1, POLYGT3_xy1( $a1 )
+	swc2	C2_SXY2, POLYGT3_xy2( $a1 )
+
+	.set noat
+
+	lui		$v1, 0x0900
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYGT3_len
+
+## Quads
+
+.prim_quad:							# Quad processing
+
+	mfc2	$t6, C2_SXY0			# Retrieve first projected vertex
+
+	lhu		$t5, 6( $t4 )			# Project the last vertex
+	addiu	$t4, 8
+	sll		$t5, 3
+	addu	$t5, $t1
+	lwc2	C2_VXY0, 0( $t5 )
+	lwc2	C2_VZ0 , 4( $t5 )
+
+	nRTPS
+
+	cfc2	$v1, C2_FLAG			# Get GTE flag value
+
+	srl		$v0, $t0, 16			# Get Z divisor from OT_LEN value
+
+	bltz	$v1, .skip_prim
+	nop
+
+	AVSZ4
+
+	andi	$v0, 0xff
+
+	mfc2	$t5, C2_OTZ
+
+	sra		$v1, $t0, 24				# Get Z offset from OT_LEN value
+
+	srl		$t5, $v0					# Apply divisor and offset
+	sub		$t5, $v1
+
+	blez	$t5, .skip_prim				# Skip primitive if less than zero
+	andi	$v1, $t0, 0xffff
+	bge		$t5, $v1, .skip_prim		# Skip primitive if greater than OT length
+	sll		$t5, 2
+	addu	$t5, $a0					# Append OTZ to OT address
+
+	# no touch:
+	# a0, a1, a2, a3, t0, t1, t2, t3, t4, t5(ot), t6(sxy0)
+
+	ClipTestQuad
+
+	and		$v0, $s0, $s1				# v0 & v1
+	beqz	$v0, .do_draw_q
+	and		$v0, $s1, $s2				# v1 & v2
+	beqz	$v0, .do_draw_q
+	and		$v0, $s2, $s3				# v2 & v3
+	beqz	$v0, .do_draw_q
+	and		$v0, $s3, $s0				# v3 & v0
+	beqz	$v0, .do_draw_q
+	and		$v0, $s0, $s2				# v0 & v2
+	beqz	$v0, .do_draw_q
+	and		$v0, $s1, $s3				# v1 & v3
+	beqz	$v0, .do_draw_q
+	nop
+	b		.skip_prim
+	nop
+
+.do_draw_q:
+
+	srl		$v0, $a3, 2					# Lighting enabled?
+	andi	$v0, 0x3
+	bnez	$v0, .F4_light
+	nop
+
+	andi	$v0, $a3, 0x10				# Gouraud quad
+	bnez	$v0, .F4_gouraud
+	nop
+
+	andi	$v0, $a3, 0x20				# Textured quad
+	bnez	$v0, .F4_textured
+	nop
+
+	lw		$v0, 0($t4)
+	lui		$v1, 0x2800
+	or		$v0, $v1
+
+	b		.sort_F4_pri
+	sw		$v0, POLYF4_rgbc($a1)
+
+.F4_gouraud:
+
+	lw		$v0, 0($t4)
+	lw		$v1, 4($t4)
+	.set noat
+	lui		$at, 0x3800
+	or		$v0, $at
+	.set at
+	sw		$v0, POLYG4_rgbc0($a1)
+	lw		$v0, 8($t4)
+	sw		$v1, POLYG4_rgbc1($a1)
+	lw		$v1, 12($t4)
+	sw		$v0, POLYG4_rgbc2($a1)
+	b		.sort_G4_pri
+	sw		$v1, POLYG4_rgbc3($a1)
+
+.F4_textured:
+
+	lw		$v0, 0($t4)
+	lui		$v1, 0x2c00
+	or		$v0, $v1
+	sw		$v0, POLYFT4_rgbc( $a1 )
+	addiu	$t4, 4
+
+	lhu		$v0, 0($t4)					# Load texture coordinates
+	lhu		$v1, 2($t4)
+	sh		$v0, POLYFT4_uv0( $a1 )
+	lhu		$v0, 4( $t4 )
+	sh		$v1, POLYFT4_uv1( $a1 )
+	lhu		$v1, 6( $t4 )
+	sh		$v0, POLYFT4_uv2( $a1 )
+	sh		$v1, POLYFT4_uv3( $a1 )
+
+	lw		$v1, 8( $t4 )
+	nop
+	andi	$v0, $v1, 0xffff
+	sh		$v0, POLYFT4_tpage( $a1 )
+	srl		$v0, $v1, 16
+
+	b		.sort_FT4_pri
+	sh		$v0, POLYFT4_clut($a1)
+
+.F4_light:
+
+	lhu		$v0, 0( $t4 )				# Load normal 0
+
+	srl		$v1, $a3, 2
+	andi	$v1, $v1, 0x3
+
+	sll		$v0, 3
+	addu	$v0, $t2
+	lwc2	C2_VXY0, 0( $v0 )
+	lwc2	C2_VZ0 , 4( $v0 )
+
+	beq		$v1, 0x2, .F4_light_smt
+	nop
+
+	lw		$v0, 4( $t4 )
+	lui		$v1, 0x2800
+	or		$v0, $v1
+	mtc2	$v0, C2_RGB
+
+	addiu	$t4, 8
+	nop
+
+	NCS
+
+	andi	$v0, $a3, 0x20				# Textured triangle
+	bnez	$v0, .F4_light_tex
+	nop
+
+	swc2	C2_RGB2, POLYF4_rgbc( $a1 )
+
+	b		.sort_F4_pri
+	nop
+
+.F4_light_tex:
+
+	lhu		$v0, 0( $t4 )				# Load texture coordinates
+	lhu		$v1, 2( $t4 )
+	sh		$v0, POLYFT4_uv0( $a1 )
+	lhu		$v0, 4( $t4 )
+	sh		$v1, POLYFT4_uv1( $a1 )
+	lhu		$v1, 6( $t4 )
+	sh		$v0, POLYFT4_uv2( $a1 )
+	sh		$v1, POLYFT4_uv3( $a1 )
+
+	lw		$v1, 8( $t4 )
+	nop
+	andi	$v0, $v1, 0xffff
+	sh		$v0, POLYFT4_tpage( $a1 )
+	srl		$v0, $v1, 16
+	sh		$v0, POLYFT4_clut( $a1 )
+
+	mfc2	$v0, C2_RGB2
+	lui		$v1, 0x2c00
+	or		$v0, $v1
+
+	b		.sort_FT4_pri
+	nop
+	sw		$v0, POLYFT4_rgbc( $a1 )
+
+.F4_light_smt:
+
+	lhu		$v0, 2( $t4 )			# Load normals 1 and 2
+	lhu		$v1, 4( $t4 )
+	sll		$v0, 3
+	sll		$v1, 3
+	addu	$v0, $t2
+	addu	$v1, $t2
+	lwc2	C2_VXY1, 0( $v0 )
+	lwc2	C2_VZ1 , 4( $v0 )
+	lwc2	C2_VXY2, 0( $v1 )
+	lwc2	C2_VZ2 , 4( $v1 )
+
+	sw		$t6, POLYFT4_xy0($a1)
+	swc2	C2_SXY0, POLYFT4_xy1($a1)
+	swc2	C2_SXY1, POLYFT4_xy2($a1)
+	swc2	C2_SXY2, POLYFT4_xy3($a1)
+
+	la		$v0, _smd_cel_tpage		# Load cel shader TPage and CLUT values
+	lw		$v0, 0($v0)
+
+	NCT
+
+	andi	$v1, $v0, 0xffff
+	sh		$v1, POLYFT4_tpage($a1)
+	srl		$v1, $v0, 16
+	sh		$v1, POLYFT4_clut($a1)
+
+	# Usable regs: v0, v1, at, t7
+
+	.set noat
+
+	la		$at, _smd_cel_param			# Load cel shader parameters
+	lhu		$at, 0($at)
+
+	mfc2	$t7, C2_RGB0
+	andi	$v1, $at, 0xff				# Get U divisor value
+	andi	$t7, 0xffff					# Only keep R and G colors
+
+	andi	$v0, $t7, 0xff				# U0
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv0($a1)
+	srl		$v0, $t7, 8					# V0
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv0+1($a1)
+
+	mfc2	$t7, C2_RGB1
+	andi	$v1, $at, 0xff
+	andi	$t7, 0xffff
+	andi	$v0, $t7, 0xff				# U1
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv1($a1)
+	srl		$v0, $t7, 8					# V1
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv1+1($a1)
+
+	mfc2	$t7, C2_RGB2
+	andi	$v1, $at, 0xff
+	andi	$t7, 0xffff
+	andi	$v0, $t7, 0xff				# U2
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv2($a1)
+	srl		$v0, $t7, 8					# V2
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv2+1($a1)
+
+	la		$v0, _smd_cel_col
+	lw		$v0, 0($v0)
+	lui		$v1, 0x2E00
+	or		$v0, $v1
+	sw		$v0, POLYFT4_rgbc($a1)
+
+	lw		$t7, 8($t4)
+
+	lhu		$v0, 6($t4)			# Load normal 3
+	addiu	$t4, 12
+	sll		$v0, 3
+	addu	$v0, $t2
+	lwc2	C2_VXY0, 0( $v0 )
+	lwc2	C2_VZ0 , 4( $v0 )
+
+	nNCS
+
+	mfc2	$s0, C2_RGB2
+	andi	$v1, $at, 0xff
+	andi	$s0, 0xffff
+	andi	$v0, $s0, 0xff				# U3
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv3($a1)
+	srl		$v0, $s0, 8					# V3
+	srl		$v1, $at, 8
+	srl		$v0, $v1
+	sb		$v0, POLYFT4_uv3+1($a1)
+
+	lui		$v1, 0x0900
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$v1, $a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $v1
+	sw		$v0, 0($t5)
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+	addiu	$a1, POLYFT4_len
+
+	.set at
+
+	andi	$v0, $a3, 0x20				# Textured quad
+	bnez	$v0, .F4_light_tex_smt
+	nop
+
+	lui		$v0, 0x2800
+	or		$t7, $v0
+	b		.sort_F4_pri
+	sw		$t7, POLYF4_rgbc($a1)
+
+.F4_light_tex_smt:
+
+	lhu		$v0, 0($t4)				# Load texture coordinates
+	lhu		$v1, 2($t4)
+	sh		$v0, POLYFT4_uv0($a1)
+	lhu		$v0, 4($t4)
+	sh		$v1, POLYFT4_uv1($a1)
+	lhu		$v1, 6($t4)
+	sh		$v0, POLYFT4_uv2($a1)
+	sh		$v1, POLYFT4_uv3($a1)
+
+	lw		$v1, 8($t4)
+
+	lui		$v0, 0x2E00
+	or		$t7, $v0
+	sw		$t7, POLYFT4_rgbc($a1)
+
+	andi	$v0, $v1, 0xffff
+	sh		$v0, POLYFT4_tpage($a1)
+	srl		$v0, $v1, 16
+
+	b		.sort_FT4_pri
+	sh		$v0, POLYFT4_clut($a1)
+
+.sort_F4_pri:
+
+	sw		$t6, POLYF4_xy0($a1)
+	swc2	C2_SXY0, POLYF4_xy1($a1)
+	swc2	C2_SXY1, POLYF4_xy2($a1)
+	swc2	C2_SXY2, POLYF4_xy3($a1)
+
+	la		$v0, _smd_tpage_base
+	lhu		$v0, 0($v0)
+	srl		$v1, $a3, 6				# Get blend mode
+	andi	$v1, 0x3
+	sll		$v1, 5
+	or		$v0, $v1
+	lui		$v1, 0xe100
+	or		$v0, $v1
+	sw		$v0, POLYF4_tpage($a1)	# Store TPage
+
+	.set noat
+
+	lui		$v1, 0x0600
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYF4_len
+
+.sort_FT4_pri:
+
+	sw		$t6, POLYFT4_xy0($a1)
+	swc2	C2_SXY0, POLYFT4_xy1($a1)
+	swc2	C2_SXY1, POLYFT4_xy2($a1)
+	swc2	C2_SXY2, POLYFT4_xy3($a1)
+
+	.set noat
+
+	lui		$v1, 0x0900
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYFT4_len
+
+.sort_G4_pri:
+
+	sw		$t6, POLYG4_xy0($a1)
+	swc2	C2_SXY0, POLYG4_xy1($a1)
+	swc2	C2_SXY1, POLYG4_xy2($a1)
+	swc2	C2_SXY2, POLYG4_xy3($a1)
+
+	la		$v0, _smd_tpage_base
+	lhu		$v0, 0($v0)
+	srl		$v1, $a3, 6				# Get blend mode
+	andi	$v1, 0x3
+	sll		$v1, 5
+	or		$v0, $v1
+	lui		$v1, 0xe100
+	or		$v0, $v1
+	sw		$v0, POLYG4_tpage($a1)	# Store TPage
+
+	.set noat
+
+	lui		$v1, 0x0900
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYG4_len
+
+.sort_GT4_pri:
+
+	sw		$t6, POLYGT4_xy0($a1)
+	swc2	C2_SXY0, POLYGT4_xy1($a1)
+	swc2	C2_SXY1, POLYGT4_xy2($a1)
+	swc2	C2_SXY2, POLYGT4_xy3($a1)
+
+	.set noat
+
+	lui		$v1, 0x0c00
+	lw		$v0, 0($t5)
+	lui		$at, 0xff00
+	and		$v1, $at
+	lui		$at, 0x00ff
+	or		$at, 0xffff
+	and		$v0, $at
+	or		$v1, $v0
+	sw		$v1, 0($a1)
+	lw		$v0, 0($t5)
+	and		$a1, $at
+	lui		$at, 0xff00
+	and		$v0, $at
+	or		$v0, $a1
+	sw		$v0, 0($t5)
+
+	.set at
+
+	lui		$v0, 0x8000
+	or		$a1, $v0
+
+	b		.sort_loop
+	addiu	$a1, POLYGT4_len
+
+.skip_prim:
+
+	b		.sort_loop
+	nop
+
+.exit:
+
+	lw		$s0, 0( $sp )
+	lw		$s1, 4( $sp )
+	lw		$s2, 8( $sp )
+	lw		$s3, 12( $sp )
+	addiu	$sp, 16
+	jr		$ra
+	move	$v0, $a1
+
+.section .bss._smd_cel_col, "w"
+.comm _smd_cel_col, 4, 4	# STP shading polygon color
+
+.section .bss._smd_cel_param, "w"
+.comm _smd_cel_param, 4, 4	# U divisor, V divisor, shading clip
+
+.section .bss._smd_cel_tpage, "w"
+.comm _smd_cel_tpage, 4, 4	# CEL shader texture page & CLUT
author	Xavier Del Campo Romero <xavi92@disroot.org>	2025-07-05 02:34:11 +0200
committer	Xavier Del Campo Romero <xavi92@disroot.org>	2025-07-05 02:34:11 +0200
commit	beb76e4dd362374b8f42cd971d394bba1074cd8d (patch)
tree	3ea4cc342737afb9225c01160c92647ba66c78bd /libpsn00b/smd/smd_cel.S
parent	5d9aa2d3dfc7d6e51c2eb942ab4cdbae5571a40a (diff)
download	psn00bsdk-fix-include.tar.gz